DeepSeek实战:3分钟学会提取网页纯文本!(含提示词)|  原创作者/编辑:凯哥Java                      |  分类:人工智能学习系列教程大家好,我是凯哥Java。今天给大家介绍如何使用DeepSeek提取网页纯文本内容。
图片
DeepSeek实战指南痛点分析:在日常工作中,我们经常需要从网页上复制文字内容,但很多网站会设置权限限制,例如:提示需要登录才能复制内容,如下图:
图片
复制需要登录的示例提示需要申请编辑权限。如下图:
图片
需要申请编辑权限的示例直接禁用右键复制功能。这些限制让我们无法快速获取所需信息,尤其是在需要整理资料或进行数据分析时,效率大大降低。PS:本文是Deepseek实战系列课程。本系列教程其他文章,还在文章末尾添加。欢迎系统学习! 解决方案针对上述问题,我们可以通过浏览器的开发者工具(DevTools)来绕过限制,直接获取网页的HTML内容,然后借助AI工具(如DeepSeek)过滤掉HTML标签,提取纯文本内容。 解决操作步骤以下是详细的操作步骤:步骤1:打开开发者工具如果使用的是谷歌浏览器,点击右上角的三个小点(菜单按钮),选择“更多工具” → “开发者工具”。
图片
打开开发者工具步骤或者直接使用快捷键:F12 步骤2:定位目标内容1.在开发者工具中,点击左上角的“元素选择器”图标(小箭头图标)。2.用鼠标点击网页上需要复制的文字内容,开发者工具会自动定位到对应的HTML元素。具体操作:如下图①;选择需要复制页面的任意文字。如下图②;根据文字元素往上找DIV。如下图③;
图片
定位目标内容步骤步骤3:找到目标DIV1.在开发者工具的“元素”面板中,找到包含目标文字的DIV元素。2.右键点击该DIV,选择“Edit as HTML”。具体操作步骤:如果能找到把整个文字选中的div就是我们的目标DIV了。如下图④所示。然后选中这个div,鼠标右键,Editer as html。这个时候就可以编辑html了
图片
找打目标div步骤
图片
Edit as HTML步骤4:复制HTML内容将编辑模式下的HTML内容全选并复制。
图片
复制HTML内容操作步骤5:使用DeepSeek过滤HTML标签将复制的内容发送给DeepSeek,并输入指令:“把我发你的字符串过滤掉HTML标签”。
图片
发送指令DeepSeek会返回过滤后的纯文本内容。
图片
DeepSeek处理后效果注意点F12被禁用:如果网站禁用了F12快捷键,可以尝试使用 Ctrl+Shift+I 打开开发者工具。内容过长:由于DeepSeek的Token限制,如果复制的HTML内容过长,可以分段截取后再发送。复杂网页:对于结构复杂的网页,可能需要多次尝试才能找到包含全部目标内容的DIV。福利:另外给大家准备了完整的deepseek资料:安装包、视频教程、学习资料、实用指令
图片
学习资料
图片
使用技巧如果有需要的朋友,你们都懂得哈~。如果需要文中截图相关文章,你们也懂得怎么获取啊~如果你们还有其他想要的实战教程,记得留言。凯哥写教程


凯哥Java
1 声望0 粉丝

自媒体:凯哥Java(kaigejava)