segmentfaultsegmentfault
注册登录
产品
社群
使用“Bing”搜本站使用“Google”搜本站使用“百度”搜本站✓站内搜索
注册登录
问答博客资讯标签用户活动

logo极客观点logo项目管理logoHarmonyOS
开发者社区

javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员

logoONES 研发管理logo思否企业问答logo安谋科技 XPU
问答博客资讯标签用户活动

logo极客观点logo项目管理logoHarmonyOS
开发者社区

javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员

logoONES 研发管理logo思否企业问答logo安谋科技 XPU

把长txt文件加入索引,搜索命中的是整个文件内容,是否有方法拆分?

头像
day_day_up
    1444
    发布于
    2016-05-16

    用fscrawler检索txt文件(可能有几百K到几M大),搜索命中的content字段包含了整个文件内容
    Elasticsearch有没有提供什么办法让搜索结果精确一些,比如到段落、句子?
    我想了下可以自己预处理一下txt,将段落作为文档插入,但好像有点傻

    elasticsearch
    阅读 4.6k
    1 个回答
    得票最新
    头像
    螃蟹在晨跑
      255128
      发布于
      2016-05-17
      ✓ 已被采纳

      加个高亮显示不就完了

      查看全部 1 个回答
      推荐问题
      • SpringBoot项目mysql+ES库集成DeepSeek在实现知识库时向量化存储和检索失败。如何在离线环境向量化?
        现在我有一个项目涉及了商业合同管理,客户要求集成DeepSeek能够根据他的提问检索到相关的合同并根据合同内容回答。当前程序使用mysql存储合同基本信息使用ES存储合同内容,合同数量很多不能全部作为知识库提供给DeepSeek,我计划先将合同内容向量化后存储到ES中,客户提问时将问题向量化后检索有关的合同内容,最后将有...

        2 回答902 阅读

      相似问题
      • springboot 2.1.6 elastic 6.7 pom文件怎么弄?

        1 回答3.1k 阅读✓ 已解决

      • 百度推荐词搜索,它搜索的内容是爬虫出来的index索引里的内容,还是另有一个索引里面有数不尽的词来提供搜索?

        1.1k 阅读

      • ES关于elasticsearch.yml文件配置问题

        1 回答3.4k 阅读

      • elasticsearch 进程的最大文件描述符太低

        1 回答464 阅读

      • 如何修改 Elasticsearch 的配置文件夹的位置?

        4k 阅读

      找不到问题?创建新问题
      宣传栏
      思否旗下产品
      SegmentFault
      思否企业服务
      思否公开课
      思否企业问答
      ONES 旗下产品
      ONES
      Tower
      为知笔记
      企业问答
      ONES.com
      项目管理百科
      资源
      每周精选
      用户排行榜
      帮助中心
      建议反馈
      声望
      勋章
      合作
      关于我们
      广告投放
      联系我们
      合作伙伴
      关注
      产品技术日志
      社区运营日志
      市场运营日志
      社区访谈
      条款
      服务协议
      隐私政策
      下载 App

      Copyright © 2011-2025 SegmentFault. 当前呈现版本 25.06.09

      浙ICP备15005796号-2浙公网安备33010602002000号ICP 经营许可 浙B2-20201554

      杭州堆栈科技有限公司版权所有

      思否 - 凝聚集体智慧,推动技术进步