程序名称
文本处理小工具


程序指南

本程序主要有两个功能:文本分词,文本分类

文本分词

功能:将句子切词统计词频
使用步骤:

  1. 文件输入路径:存放待分词句子的文件,文件必须是.xlsx格式,目前已支持中文路径
    图片描述

  2. 表名:即.xlsx文件中的sheet名,默认为Sheet1,可以修改,目前已经支持中文表名
    图片描述

  3. 分析列:即待分词句子所在的列
    图片描述

  4. 文件输出路径:将处理完毕的文件放置的位置
    图片描述

  5. 已处理行数: 程序已经读完的行数。
    图片描述

  6. 点击运行即可

  7. 退出,程序中断(这个部分还未完成,目前只能通过关闭整个工具完成)
    结果:

程序完成后会在你选择的路径生成相应文件

文本分类

功能:通过分类器分析句子所在类别
使用步骤:

  1. 文件输入路径:存放待分词句子的文件,文件必须是.xlsx格式
    图片描述

  2. 表名:即.xlsx文件中的sheet名,默认为Sheet1,可以修改
    图片描述

  3. 分析列:即待分词句子所在的列
    图片描述

  4. 分类项目:选择不同的分类器
    图片描述

  5. 选择服务器:不同的分类器部署在不同的服务器上,需分清
    图片描述图片描述

  6. 文件输出路径:将处理完毕的文件放置的位置
    图片描述

  7. 默认情况下,打标签失败的数据丢弃,这里可以选择保留全数据,保留没有打上标签的数据
    图片描述

  8. 已处理行数: 程序已经读完的行数。
    图片描述

  9. 点击运行即可

  10. 退出,程序中断(这个部分还未完成,目前只能通过关闭整个工具完成)
    结果:

程序完成后会在你选择的路径生成相应文件


孙强_dp
145 声望7 粉丝

做一个有趣的人