AI技术发展变的是数据来源没变的是数据质量
编辑
3
2025-04-01

AI技术发展:变的是数据来源,没变的是数据质量
需求一直在那里,但是一直没被满足好。
以前的数据散落在各处,就像大众点评上找餐厅,我们通过搜索引擎获得了一些坐标,并前往去寻找。
现在的数据则被汇聚到了模型里,就像一个中央厨房,我们可以随时打开一份预制菜,在家食用。
但是预制菜单,就是不太新鲜,所以我们做了定期更新RAG,MT AI 预训练,获取新鲜的实时信息。
大到金融、医疗,小到生活百科,我们的需求一直是高质量的数据,高质量的信息。但需求从未被满足。不管是模型预训练的数据,SFT的数据,还是RAG的数据,质量都是第一性原理。
好数据出好结果,没有捷径,从未改变。
前几天和一位朋友事吃饭,他说了一句金句
最近的 AI 资讯真是噪音。
原因是 AI 技术的进展很小,可用性也不高,关注这样的资讯,反而不如花时间深度思考和执行 。
这句话其实得很多人的共鸣。
本质是因为每个人所需要的好数据也是不同的。
自己不需要的信息,其实就是噪音。
人们需要的从来不是那么多信息,而是自己关心的信息。
如果 AI 对你的兴趣有足够多足深的了解,就会成为比推荐算法更强的推荐引擎。
需求如山,而山,一直在那里。
- 0
- 0
-
分享