新项目使维基百科数据对人工智能更易获取

新项目使维基百科数据对人工智能更易获取

当地时间周三,维基百科德国宣布推出一个新数据库,将使维基百科丰富的知识对人工智能模型更易获取。该系统名为“维基数据嵌入项目”,对维基百科及其姊妹平台上的现有数据应用基于向量的语义搜索,包含近1.2亿个条目。结合对模型上下文协议(MCP)的新支持,该项目使大型语言模型的自然语言查询更易于获取这些数据。该项目由维基百科德国分会与神经搜索公司Jina.AI和IBM 旗下实时训练数据公司DataStax合作开展。新系统将更好地与检索增强生成(RAG)系统协同工作,这些系统允许人工智能模型引入外部信息,为开发者提供将其模型建立在经维基百科编辑核实的知识基础上的机会。

—— Techcrunch

*

发表评论 (0)
后一页 前一页