全文搜索支持在文档内容中查找与搜索词匹配的项,而标准搜索只在文档字段中查找匹配项。
注意:出于性能原因,全文搜索只返回前 5,000 个匹配文档。
如何搜索文档内容
只能从高级搜索对话框中使用全文搜索。要在搜索中包含文档内容:
- 单击搜索栏中的双目镜筒图标,以打开高级搜索。
- 在搜索范围中,选择包含内容。
- 根据需要填写剩余字段。
搜索字母数字和标点字段时,Vault 会将搜索词分隔成不同的段。此过程叫作“词语切分”。
关于搜索结果
当您在文档内容中进行搜索时,Vault 会对文档字段和文档内容分别进行搜索,然后合并最终的结果集。如果搜索结果包含超过 5,000 个文档,Vault 将把结果限制在最相关的前 5,000 个文档,并显示警告。要查看完整的结果集,请在执行下一个全文搜索之前应用额外的筛选器。
搜索结果页面
如果 Vault 在文档内容中找到搜索词匹配项,那么搜索结果页面将显示文档的摘录,以提供匹配词的上下文。
对全文搜索编制索引
Vault 自动使用受支持的源文件格式对文档的全文编制索引,以支持全文搜索。文档内容通常在上传后的几分钟即可供搜索,但如果 Vault 同时上传多个文档,则可能出现延迟。同时也会对文档和对象附件编制索引。
可搜索的扫描文件
对于用户上传的图像或 PDF 文件的扫描源文件,Vault 可以提取其中的文本并对其编制索引。这种称为光学文字识别 (OCR) 的功能允许您对这些文档使用全文搜索。Vault 只提取输入的英文文本。
文本提取支持的格式
OCR 将自动尝试从具有以下受支持格式的文件中提取文本:
- PDF(仅当 PDF 不包含文本时)
- 可移植网络图形 (PNG)
- 标签图像文件格式(TIF、TIFF)
- JPEG(JPEG、JPG)
- 图形交换格式 (GIF) 图像
- 位图 (BMP)