Netflix 和亚马逊等公司使用推荐引擎,根据用户行为推荐产品或内容。例如,当你在亚马逊上购买一件商品后,系统会向你展示其他可能感兴趣的产品。同样,Netflix 也会根据你的观看记录推荐电视节目和电影。
我们将同样的理念应用于互联网上的高端技术应用。我们的系统通过分析其他具有类似高端技术配置的网站的行为,来预测网站可能考虑使用的技术。
工作原理
- 我们识别出在技术方面投入巨资的网站,并确定它们使用的技术。
- 我们通过衡量这些技术之间的重叠程度来确定网站之间的相似度。
- 重叠部分越大,就越能体现出对一个网站正在使用而另一个网站未使用的高级技术的推荐。
为什么我们不使用传统人工智能模型
你可能会好奇为什么我们的推荐系统不使用矩阵分解等机器学习方法。我们测试过几种人工智能模型,但结果都不尽如人意。这些模型还依赖于复杂的内部参数,通常被称为“魔法数字”,这些参数难以解释或控制。
例如,MatrixFactorizationTrainer 的文档中包含“为了获得更好的结果,请使用以下设置”这句话,后面紧跟着两个未解释的变量。文档并未说明这些值为何能改善结果,这使得模型难以验证和信任。
相比之下,我们选择的算法遵循清晰且易于理解的方法论。我们确切地知道它的工作原理、实现方式以及它为何能产生有意义的结果。
它真的有效吗?
是的。例如,该模型识别出那些可能采用 Magento Enterprise 的网站通常已经在使用 Magento。这种关联并非人工定义或训练到系统中,而是通过数据本身发现的。
推荐 API
您可以通过我们的 API 以编程方式访问这些推荐信息,该 API 提供 JSON 和 XML 两种响应格式。https
://api.builtwith.com/recommendations-api自制模型
您可以使用 BuiltWith 数据集创建自己的模型,该数据集提供训练和实验所需的基础数据。