python怎么给原有模块添加自定义方法?

from bs4 import BeautifulSoup as bs
soup=bs(html_code) #伪代码
text=soup.get_text()       #这个get_text()方法是bs定义好了的方法
my_text=soup.my_get_text() #这个my_get_text()方法是bs没有的方法,会报异常

如上代码,比如bs中本来没有my_get_text()这个方法,
我是否可以写一个自定义模块,比如叫做'my_bs',

import my_bs

当如上导入自定义的模块后,
就能正常运行如下代码:my_text=soup.my_get_text()
说白了,我就是想给已有的bs4包添加一个我自己定义的方法.
但是不是通过修改bs4的源代码,而是自定义一个模块,
在自己的代码中导入自定义模块来达到目的.
多谢!

阅读 4.2k
3 个回答
# 如果是类, 试试
# 让bs继承my_bs的方法
my_bs.register(bs)

# for module
# setattr(module, attr, newitem)
setattr(bs, "my_get_text", my_bs.my_get_text)

继承

class mybs(bs):
    def my_get_text(self):
        pass

新建myBS.py文件,内容如下:

import bs4

def getTextWithoutScript(self, separator=u"", strip=False,
                                     withoutScript=True, withoutComment=True):
    """获取网页文本,不包含html源码中的script脚本的内容"""
    return separator.join([s for s in self._all_strings(strip) if s.parent.name.lower() != 'script'])

bs4.Tag.getTextWithoutScript = getTextWithoutScript

使用方法:
首先导入myBS.py,其他使用方法就是直接调用,与bs的原生方法一样:

import myBS
from bs4 import BeautifulSoup as bs

s=bs(html_code,'html5lib')
s.getTextWithoutScript()

不方便的地方:在pycharm下该新加入BS的方法不能智能提示!
感谢诸位老师!

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题