平均而言该模型仅等待个上下文标记

ditihekhatun16 · 發表於 2024-5-9 18:59:06

国际化到目前为止我们最好的成果是英文成绩单。这主要是由于资源问题虽然有许多相对较大的标记会话数据集包含英语不流利的内容但其他语言的可用此类数据集通常很少。因此为了使不流利检测模型在英语之外可用需要一种方法来构建模型而无需在每种目标语言中查找和标记数十万个话语。一个有前途的解决方案是利用的多语言版本将模型所了解的英语不流利程度转移到其他语言以便用更少的数据实现类似的性能。这是一个活跃的研究领域但我们确实有一些有希望的结果可以在这里概述。作为验证此方法的第一步我们为德国数据集中的约行对话添加了标签。

然后我们从英语和德语双语模型从多语言中提取开始并使用大约个不流利标记的英语示例和来自的万个自标记转录本示例对其进行微调。然后我们对德国数据集中约个内部标记的示例进 格鲁吉亚电话号码列表 行了进一步的微调。该图说明了我们最好的多语言训练设置中的标记数据流和自我训练输出。通过英语和德语数据的训练我们能够通过迁移学习来提高性能。我们的结果表明使用零样本迁移到德语等类似语言对大型英语语料库进行微调可以产生可接受的精度但至少需要适量的德语标签才能将召回率从低于提高到高于。英德双语模型的两阶段微调产生了最高的精度和总体分数。方法精确记起德国模型在个人工标记的德国示例上进行了微调与上面相同但附加了个自标记的德语示例英语德语双语模型在英语上进行微调在德语上进行评估零样本语言迁移与上面相同但随后使用个德语人类和自我标记示例进行微调结论清理转录本中的不连贯之处不仅可以提高人们的可读性还可以提高使用转录本的其他模型的性能。

语言模型在各种自然语言任务上都表现出了卓越的性能——事实上从包括和在内的许多作品中得到的普遍教训是神经网络在无监督的情况下大规模地对各种数据进行训练。的方式可以很好地执行各种任务。定量推理是语言模型的性能仍远远低于人类水平的领域之一。解决数学和科学问题需要多种技能的结合包括用自然语言和数学符号正确解析问题回忆相关公式和常数以及生成涉及数值计算和符号操作的逐步解决方案。由于这些挑战人们通常认为使用机器学习解决定量推理问题将需要模型架构和训练技术方面的重大进步允许模型访问解释器等外部工具或者可能需要更深刻的范式转变。

		自動登錄	找回密碼
密碼			立即註冊