这次练习的题目是实现一个简单的RSS功能,需要了解的知识点:

  1. tkinter,在上一篇《简单的记事本》中已经了解了一些tkinter的用法,在这里延续了上一篇,加深一下印象。

  2. urllib,HTMLPaser库的使用,注意python3已经与python2有了很大不同。

# -*- coding:utf-8 -*-
#编码声明
 
# file: run_rss_one.py
#文件名
 
import tkinter
import urllib
import requests
from html.parser import HTMLParser
import os



#导入方法模块
class MyHtmlParser(HTMLParser):

    def __init__(self,edit):
        HTMLParser.__init__(self)
        self.edit = edit
        self.a_title = False
        self.a_text = False
    def handle_starttag(self,tag,attrs):
        if tag == 'title':
            self.a_title = True
        if tag == 'a':
            self.a_text=True
        
    def handle_endtag(self,tag):
        if tag == 'title':
            self.a_title = False
        if tag == 'a':
            self.a_text = False
    def handle_data(self,data):
        if self.a_title:
            self.edit.insert(tkinter.END,data)
        if self.a_text:
            self.edit.insert(tkinter.END,data+'\n')

这里class MyHtmlParser继承了HTMLParser,根据这个模板你可以添加你自己需要从网页上获取的内容了,假设你的网页中有标签p,试一试新增一个属性self.a_p
另外对于HTMLParser,这个了解起来可以需要费一些功夫,不过又有什么关系呢,你所浪费掉的时间总会在某个时候得到收获的,人生嘛时间不浪费在这里也会浪费在那里。

对于下面的class Window,定义了一些窗口属性,接下来在代码中我会简单记录一下它的用法。

class Window:
    def __init__(self, root):
        self.root = root     
        self.entryUrl = tkinter.Entry(root,width = 30)#Entry是输入控件
        self.entryUrl.place(x = 65, y = 15)#place定义了它放置的位置,然后如下的控件皆按照这样的方式定义好了
        #这里self.Get在这个函数中展示了输出的东西,当点击按钮时候,就会显示到文本框中
        self.get = tkinter.Button(root,
                text = '读取RSS', command = self.Get, font = ('system','10'))
        self.get.place(x = 350, y = 15)
        self.frame = tkinter.Frame(root, bd=2)
        self.scrollbar = tkinter.Scrollbar(self.frame)
        self.edit = tkinter.Text(self.frame,yscrollcommand = self.scrollbar.set,
                width = 96, height = 32)  
        self.scrollbar.config(command=self.edit.yview)
        self.edit.pack(side = tkinter.LEFT)
        self.scrollbar.pack(side=tkinter.RIGHT, fill=tkinter.Y)
        self.frame.place(y = 60)
        #用label定义一个提示输入的内容,然后把这个内容放置到输入框的下方
        self.indicate=tkinter.Label(root,text='(Please input: local path or url)',fg='red')
        self.indicate.place(x=65,y=35)
 
    def Get(self):
        url = self.entryUrl.get()
        #做一个判断如果是本地路径就获取文件名
        if os.path.isdir(url):
            #如果要循环读取目录及子目录,用os.walk
            dir=os.listdir(url) 
            #把路径下所有的文件及目录都展示在tkinter的文本框中,请回顾init中内容,self.edit本质就是一个Text阿
            for dir_n in dir:
                self.edit.insert(tkinter.END,url+ ' ' +dir_n+'\n') 
                #在这里也可以继续深入,对路径下的文件判断,比如获取文中的几行内容,抑或是对路径下的目录继续统计下去         
        else: 
            #注意python3的用法要加request
            response=urllib.request.urlopen(url)
            page = response.read()  # 读取URL内容
            hp = MyHtmlParser(self.edit) #解析html
            hp.feed(page.decode('utf-8')) #feed(),主要用于接受带html标签的str,当调用这个方法并提供相应的data时,实例开始执行
            hp.close()#结束执行close()

在这里通过HTMLPaser对解析html有了一个简单的了解,在下一篇文章中,会继续延续此文的内容,主要重点放在获取某个网站的特定内容。
所以今天你走过的路决定了你明天可以走的路,每一个障碍都要及时解决,不要轻易绕过

然后再添加上主体控制部分,就可以运行你的文件试一试了。

root = tkinter.Tk()
root.title('RSS 阅读器')
window = Window(root)
root.minsize(700,500)
root.maxsize(700,500)
root.mainloop()

新手之作,欢迎探讨一块儿学习。


Hi月光碎片
24 声望6 粉丝