先贴代码,原理有时间补上。 代码中两种方式实现了ndcg的计算,调用的时候需要注意一下。 ...
隐私信息检索 Private Information Retrieval PIR 技术是解决保护用户查询隐私的方案,保证查询用户在向服务器上的数据库提交查询请求,在用户查询隐私信息不被泄漏给服务器的条件下完成查询,即在过程中服务器不知道用户具体查询信息及检索出的数据项。现在的PIR方案主要分为:信息论安全PIR 计算安全PIR 基于硬件的PIR。 基于隐私信息检索 PIR 的隐私保护方法案例:假 ...
2020-08-04 19:43 0 1452 推荐指数:
先贴代码,原理有时间补上。 代码中两种方式实现了ndcg的计算,调用的时候需要注意一下。 ...
摘要:PSI全称隐私保护集合交集(Private Set Intersection, PSI),是指持有数据的两方能够计算得到双方数据集合的交集部分,而不暴露交集以外的任何数据集合信息。 本文分享自华为云社区《浅谈PSI隐私集合求交》,原文作者:tics神奇海螺 。 1、简介 ...
由 ARPA 联合创始人兼 CEO 徐茂桐撰写,ARPA 是一家致力于为企业提供数据安全隐私的计算解决 ...
针对Android App隐私信息检测 尝试采用Frida进行处理。 目前的一个思路就是trace app中所有调用系统函数的功能,这个方法不够细致,无法判断是app自身调用的还是app调用的sdk调用的。 https://github.com/zhengjim/camille 昨天尝试 ...
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频)https://study.163.com/course/introduction.htm?courseId=1005269003 ...
在全文检索中,分词处理对性能的影响很大,包括索引大小、检索速度、准确度等方面。 一个好的分词处理应该具备哪些特性呢? 1)速度、准确度 2)自定义词典 3)对英文、数字符号、日期、繁简转换等的优化 中文分词算法大概分为两大类 1、字符串匹配(基于词典) 这一算法其实就是使用 ...
总览 搜索引擎的六个核心组件:爬虫、解析、索引、链接关系分析、查询处理、排名 信息检索中的代表性排序模型: 1)传统的排序模型:两类 1. 相关性排序模型: a) Boolean model: 基于查询term在文档里出现的情况,但不能预测相关性 ...
测试数据集 一个文档集 一组用于测试的信息需求集合,信息需求可以表示为查询 一组相关性判定结果,对应每个查询-文档,通常会赋予一个二值判定结果: 相关/不相关 经验发现一般测试的查询数应>=50。 无序检索结果的评价 准确率和召回率 对于一个查询,根据其返回 ...