坚固与脆弱
虽然在主动学习中,标签源理论上总是提供 100% 准确的 有一个分类任务需要 标签,但在弱监督中,我们可能会遇到无法标记所有样本且准确度较低的弱源。
单一与多重
主动学习通常被描述为一种依赖单一且昂贵的标签来源的系统。弱监督则依赖许多不太准确的来源。
人机交互与先前模型训练
在主动学习中,标签被提供为模型改 WhatsApp 号码数据 进在人机交互过程中。相比之下,在弱监督中,在模型训练之前,所有弱源都会提供噪声标签。
从电影评价到任何分类任务
我们关于融合人们的电影评论的示例有助于通过直观的 扩大你的时事通讯受众 示例解释弱监督框架。但是,对于电影推荐用例,有比弱监督更好的算法(例如协同过滤)。弱监督之所以强大,是因为它可以在任何地方使用:
你想使用监督机器学习
用于训练模型的数据集未标记
您可以使用弱标签源
这些要求非常灵活,使得弱监督适用 能的 印度手机号码 解决方案 于许多用例,而在这些用例中,主动学习在手动标记方面会耗费更多时间。
您的未标记文档、图像或客户数据集可能具有弱标签源,就像您有“朋友对“电影”的看法”一样。这些“朋友”可以被视为 标签函数 ,它们只能标记行的子集(在示例中,只有他们看过的“电影”),准确度高于随机。我们拥有的“意见”(“?”或“?”)是标签函数的输出标签。