最近,一个名叫 Magi 的搜索引擎成了重点关注对象,天辰注册据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。
确实,这个页面看着就很让人舒爽。
重要的是搜索结果也很不一般,属性中的每一个结果有对应的链接,并带有标签和主要学习来源部分,搜索结果以结构化知识的形式呈现。这种模式和国内外主流的搜索引擎完全不一样,让人感觉新鲜。
当然,也让人由此发出疑问:Magi 到底是什么,是谁开发的,好不好用?
按照开发者 PeakJi 季逸超的讲述和 Magi 网站上的说明,Magi 其实并不是单纯的网页搜索引擎,而是自主阅读文本并持续纠错的 AI。
Magi 是由 Peak Labs 从无到有自研的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。11 月,Peak Labs 发布了公众版 Magi.com。
与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。此外,Magi 从零研发了一套互联网搜索引擎,所以 Magi.com 同时提供全网规模的普通搜索结果,学习过程是在无人干预的情况下 7 x 24 小时不间断运行。
互联网数据浩如烟海,质量参差不齐,如何将这些数据处理成机器能够理解的数据结构时隔巨大的挑战。在「Magi 的使命」一项中,Peak Labs这样写道:作为公众版本的 magi.com 为人类用户提供了与互联网数据交互的新方式,而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。
对 Magi 的技术感兴趣的同学,可以访问 www.peak-labs.com 官网和季逸超的知乎,我们在这里就不多说了。
下面来关注一下 Magi 背后的团队——Peak Labs,以及创始人 PeakJi 。
创始人 PeakJi 真名季逸超,90 后男生,在北大附中读高中期间接触 iOS 并加入威锋网 WEIP 技术组,先后参与了 wefit 输入法的完善和各种越狱研究,高三设计并开发猛犸 1 网页浏览器,大一推出猛犸 4。据说,PeakJi 所有的产品都是由他独自完成设计、美工、算法、编码、测试和推广,可见啊这是一个非常有想法,动手能力也很强的「技术宅」了。
2012 年,在北大念书的季逸超创建 Peak Labs,并发明了 Rasgueado 输入法。据说 Peak Labs 的产品和技术还有很多,什么神经信息提取系统 Ireul,网页大规模搜索引擎 Ramiel,多语言分析 pipeline Arael 和分布式检索系统 Matarael 等等,利用这些技术构架,他们搭建了 Magi 服务,包括普惠版和企业版两种。
如果你要问 Magi 好不好用,我们暂时也无法给出明确回答,因为 Magi 目前完成度还有待提高。但是,比起当做搜索引擎来用,Magi 应该更适合做知识学习链库。
在使用的过程,我们会发现 Magi 也有很多不足之处,尤其是在搜索规模和答案准确度上。面对一些简单搜索,Magi 往往给不出让人满意的答案,而且速度也不够快。另外,它不是一款搜索引擎,像搜索网址这类任务也达不到很好的效果,也无法进行图片搜索。
对于 Magi 的缺点,团队和 PeakJi 都大方坦诚。
Peak Labs 指出,Magi 已经展示出的开放领域信息提取能力,可以应用到企业客户所在的细分领域内,变成一个更加强大的信息抽取系统,让每一个领域、每一家企业都可以轻松地打造属于自己的知识图谱,他们希望未来的 Magi 系统能够成为「知识领域的 ImageNet」。
Magi 现在还远算不上成熟,但其特性决定了它无穷的可能性和成长空间。未来,也许 Magi 会成为打破现有搜索引擎原理的新范式,开启全新的结构化知识搜索引擎时代,改变我们对信息检索和知识获取方式的刻板印象,毕竟在信息大革命和人工智能大发展的时代,千帆竞速,天辰注册百舸争流,谁都有机会。