原文:淘宝推荐、视频搜索背后的检索技术竟是它!深度揭秘达摩院向量检索引擎Proxima

简介: 淘宝搜索推荐 视频搜索的背后使用了什么样的检索技术 非结构化数据检索,向量检索,以及多模态检索,它们到底解决了什么问题 今天由阿里巴巴达摩院的科学家从业务问题出发,抽丝剥茧,深度揭秘达摩院内部技术 向量检索引擎 Proxima,以及相关领域的现状 挑战和未来。 人工智能,简称 AI,是计算机发明时就存在的一个技术领域。它的一大核心特点就是可以类人脑地辅助人类工作。其通过一系列数学的方法, ...

2021-03-08 10:40 0 270 推荐指数:

查看详情

搜索引擎概述之布尔检索

阅读本篇文章首先要对“词汇文档矩阵”和“倒排索引”有个基本的认识,要了解相关的知识可以阅读上一篇文章:搜索引擎概述之倒排索引索引。 布尔检索是最基础,也是使用最广泛的信息检索模型了。所谓布尔查询就是通过AND、OR、NOT等逻辑操作符将检索词连接起来的查询。比如: 李白 AND (杜甫 ...

Mon Jun 04 20:14:00 CST 2018 0 2068
Apache Lucene(全文检索引擎)—搜索

) 1. 搜索思路   a. 当用户在搜索的时候,先在词汇表中查找,得到符合条件的文档编号列表,再根据 ...

Thu Apr 14 23:39:00 CST 2016 2 2549
这就是搜索引擎--读书笔记八--检索模型与搜索排序

检索模型与搜索排序 前言 搜索结果排序是搜索引擎最核心的构成部分,很大程度上决定了搜索引擎的质量好坏以及用户接受与否。尽管搜索引擎在实际结果排序时融合了上百种排序因子,但最重要的两个因素还是用户查询和网页的内容相关性及网页链接情况。那么,我们得到用户搜索词之后,如何从内容相关性的角度 ...

Wed Jun 10 08:25:00 CST 2015 1 2091
信息检索技术——向量空间模型

上次介绍了信息检索技术——布尔检索,布尔模型已经可以解决一个很重要的问题,就是找到和用户需求相关的文档(其中还需要很多处理,比如分词,归一化,去掉停用词等等,我们只是介绍主要的框架流程)。但是这样找到的文档会有很多,也许上千个,也许上万个,这远远不是用户所要的。用户也不会去从几万个文档中挑选 ...

Wed Mar 28 17:49:00 CST 2012 3 11293
全文检索引擎Solr的配置

描述: 在Linux环境下实现高速的全文检索 一、当前环境: CentOS (Linux) 6.3 64 bit 二、所需软件 1、Java的JDK Java jdk 1.7.0【注意:solr5.x版本必须安装java 1.7及以上版本 ...

Mon Dec 22 02:35:00 CST 2014 0 2755
搜索引擎中输入检索词到返回十条结果,发生了哪些事情

移动互联网时代搜索引擎依然是重要流量来源以及流量分发渠道,虽然比PC互联网时代权重有所降低。 各大电商淘宝、京东80-90%交易额也是由用户app内搜索、网站内搜索产生,个性化推荐系统本身也和搜索 引擎无论技术还是产品方方面面都与搜索引擎有着关联,我们每天也都和搜索引擎打着交道 ...

Wed Nov 08 20:42:00 CST 2017 3 2438
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM