LOSS - Search 学术

反馈建议及合作事宜，欢迎联系我们：

zhihu.com
https://www.zhihu.com › question
深度学习的loss一般收敛到多少？ - 知乎
1. Loss值能否作为衡量模型性能的指标之所以说几乎不能，是因为对于分类问题，模型的loss值与咱们关心的模型指标（metrics）有一定的相关性，但不是绝对相关，所以loss值本身不能作为 …
zhihu.com
https://www.zhihu.com › question
深度学习的多个loss如何平衡？ - 知乎
多个loss引入 pareto优化理论，基本都可以涨点的。例子： Multi-Task Learning as Multi-Objective Optimization 可以写一个通用的class用来优化一个多loss的损失函数，套进任何方法 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
大模型优化利器：RLHF之PPO、DPO
最终，我们可以得出 DPO 的 loss 如下所示：这就是 DPO 的 loss。 DPO 通过以上的公式转换把 RLHF 巧妙地转化为了 SFT，在训练的时候不再需要同时跑 4 个模型（Actor Model 、Reward …
zhihu.com
https://www.zhihu.com › question › answers › updated
深度学习模型训练的时候，一般把epoch设置多大？ - 知乎
在机器学习中，epoch 数量是指整个训练集通过模型的次数。一个Epoch意味着训练数据集中的每个样本都有机会更新内部模型参数。 Epoch由一个或多个Batch组成。选择合适的 epoch 数 …
zhihu.com
https://www.zhihu.com › tardis › zm › art
损失函数｜交叉熵损失函数
对所有样本的loss求平均：我们发现，MSE能够判断出来模型2 优于模型1，那为什么不采样这种损失函数呢？
zhihu.com
https://www.zhihu.com › question
哪里有标准的机器学习术语 (翻译)对照表？ - 知乎
L_1正则化 ( L_1Regularization) 一种正则化，根据权重的绝对值的总和来惩罚权重。在依赖稀疏特征的模型中， L_1 正则化有助于使不相关或几乎不相关的特征的权重正好为 0，从而将这些 …
zhihu.com
https://www.zhihu.com › question
GAN生成对抗网络D_loss和G_loss到底应该怎样变化？ - 知乎
做GAN有一段时间了，可以回答下这个问题。 G是你的任务核心，最后推理用的也是G，所以G的LOSS是要下降收敛接近0的，G的目标是要欺骗到D。而成功的训练中，由于要达到G欺骗D …
zhihu.com
https://www.zhihu.com › question
pytorch中第一轮训练loss就是nan是为什么啊？ - 知乎
首先我不是很清楚你这个第一轮指得是epoch还是iteration，如果是epoch网上有很多方法（调学习率啥啥啥的），但是如果你是第一个iteration后就出现nan，那或许我接下来说的东西可能会 …
zhihu.com
https://www.zhihu.com › question
如何理解Adam算法 (Adaptive Moment Estimation)？ - 知乎
(我曾写过一个Momentum的简单介绍：怎么通俗易懂的理解SGD中Momentum的含义？ ) Adaptive Learning Rate则是利用过去梯度second moment信息来确定各个方向的学习率的大 …
baidu.com
https://zhidao.baidu.com › question
csgo帧数显示指令 - 百度知道
“游戏开始界面“选项”“游戏设置”;找到“启用开发者控制台 (~)”，选择“是”;之后，在游戏中只要按“~”按键 (Esc下面)即可开启控制台;显示帧数 (FPS)及网络参数 (PING、LOSS、CHOKE …

微软学术致力于提供来自全球的多语种文献检索服务。反馈建议及合作事宜，欢迎联系我们：bingopen@microsoft.com

Cite

Download

深度学习的loss一般收敛到多少？ - 知乎

深度学习的多个loss如何平衡？ - 知乎

大模型优化利器：RLHF之PPO、DPO

深度学习模型训练的时候，一般把epoch设置多大？ - 知乎

损失函数｜交叉熵损失函数

哪里有标准的机器学习术语 (翻译)对照表？ - 知乎

GAN生成对抗网络D_loss和G_loss到底应该怎样变化？ - 知乎

pytorch中第一轮训练loss就是nan是为什么啊？ - 知乎

如何理解Adam算法 (Adaptive Moment Estimation)？ - 知乎

csgo帧数显示指令 - 百度知道

zproxy.org