头图

cnblogs和其他的博客平台相比会比较复杂,需要设置的项目也比较多一些,弄懂了cnblogs的实现方式,那么你应该对selenium的整个框架使用已经烂熟于心了。

除了正常的标题,内容,摘要之外,cnblogs还需要设置个人分类,合集,投稿选项,投稿至网站分类,tags标签等内容。

要填的东西比较多,比较复杂。接下来我们会一项项的介绍cnblogs的具体实现方式。

前提条件

前提条件当然是先下载 blog-auto-publishing-tools这个博客自动发布工具,地址如下:https://github.com/ddean2009/blog-auto-publishing-tools

cnblogs的实现

因为需要设置个人分类,合集,投稿选项,投稿至网站分类,tags标签等内容,所以我们需要在配置文件中提供这些内容。

配置文件在config/cnblogs.yaml中。

首先是个人分类和合集部分:

# 个人分类  工具技巧 AIGC
categories:
  - 工具技巧

# 添加到合集: 工具技巧 AIGC
collections:
  - 工具技巧

这两个部分都是需要你自己提前在cnblogs中创建好的。否则你会找不到这些内容,对应的界面地址如下:

image-20240507171326499

接下来是投顾至网站分类:

image-20240507171845646

cnblogs的这些网站分类是直接用文字来说明的,所以我们需要在配置文件中再定义一个网站分类:

topic: 开源研究

最后就是tag标签了,我们直接设置即可:

tags:
  - 人工智能
  - aigc
  - openai
  - ai开发
  - 程序那些事

image-20240507172029658

文章标题

不得不说cnblogs的实现就是正规,cnblogs几乎每个输入的标签都是带有ID的,所以我们实现起来特别的简单,这里要给cnblogs点个赞。

    # 文章标题
    title = driver.find_element(By.ID, 'post-title')
    title.clear()
    if 'title' in front_matter['title'] and front_matter['title']:
        title.send_keys(front_matter['title'])
    else:
        title.send_keys(common_config['title'])
    time.sleep(2)  # 等待2秒

我们找到ID,直接调用send_keys方法即可。

文章内容

cnblogs的文章内容是一个textarea,也是带有ID的,所以我们直接根据ID获取即可:

    # 文章内容
    file_content = read_file_with_footer(common_config['content'])
    content = driver.find_element(By.ID, 'md-editor')
    content.send_keys(file_content)
    time.sleep(5)  # 等待5秒

页面滚动

如果你观察cnblogs的页面,可以看到文章内容之后已经占满了整个屏幕,如果我们还需要继续处理后面的内容的话,就需要对页面进行一个滚动操作。

这里我们借用了ActionChains的scroll to element方法。

首先我们找到最下面的发布按钮,然后直接滚动到这个发布按钮即可。

    # 滚轮滚到最下面的位置
    submit_button = driver.find_element(By.XPATH, '//button[@data-el-locator="publishBtn"]')
    ActionChains(driver) \
        .scroll_to_element(submit_button) \
        .perform()
    time.sleep(1)

个人分类

个人分类是一个下拉框。

image-20240507173020475

他有一个比较特别的tag name叫做cnb-post-category-select。

所以我们可以通过这个tag name找到这个元素,然后点击他。

因为所有的要选择的元素都是在cnb-post-category-select这个tag内部的,所以我们调用post_category_select.find_element来查找它内部的input元素。

找到之后,我们输入个人分类,然后从下拉框中选择对应的个人分类tag,然后点击回车。

所有的个人分类都选择完毕之后,我们再次点击post_category_select,以关闭下拉框。

对应的代码如下:

    # 个人分类
    categories = cnblogs_config['categories']
    if categories:
        post_category_select = driver.find_element(By.TAG_NAME, 'cnb-post-category-select')
        post_category_select.click()
        for category in categories:
            category_search = post_category_select.find_element(By.XPATH, '//nz-select-search/input')
            category_search.send_keys(category)
            time.sleep(1)
            category_select = post_category_select.find_element(By.XPATH, f'//nz-tree-node-title[contains(@title, "{category}")]/div')
            category_select.click()
            time.sleep(0.5)
        post_category_select.click()
    time.sleep(2)

添加到合集

添加到合集的实现方式跟个人分类有些类似。

image-20240507173806856

默认情况下,添加到合集这个选项中的内容是隐藏的,所以我们需要首先点击这个选项头,让对应的选项露出来。

这里可以通过name来获取到这个元素。然后点击。

接下来就是通过text属性来查找collection_select中要选择的合集元素,然后点击他们。

注意,这里如果选择的是包含合集文字的span,如下所示。这个span是不可被点击的。

所以我们的解决办法就是找到它的父元素。

通过: collection_item.find_element(By.XPATH, '..') 来实现。

然后点击他的父元素即可。

image-20240507174113523

最终的实现代码如下:

    # 添加到合集
    collections = cnblogs_config['collections']
    if collections:
        collection_select = driver.find_element(By.NAME, '添加到合集')
        collection_select.click()
        # print(collection_select.get_attribute('innerHTML'))
        for collection in collections:
            collection_item = collection_select.find_element(By.XPATH, f'//span[contains(@class,"item__text") and contains(text(), "{collection}")]')
            parent_element = collection_item.find_element(By.XPATH, '..')
            # print(parent_element.tag_name)
            parent_element.click()
            time.sleep(0.5)
    time.sleep(2)

投稿选项

投稿选项比较简单,直接通过ID选择即可:

    # 投稿选项
    post_type = driver.find_element(By.ID, 'site-publish-site-home')
    post_type.click()
    time.sleep(2)

投顾至网站分类

网站分类的ID就是分类的名字,所以,我们可以下面代码来实现:

    # 投顾至网站分类
    topic = cnblogs_config['topic']
    if topic:
        post_type_detail = driver.find_element(By.NAME, '投稿至网站分类')
        post_type_detail.click()
        topic_item = driver.find_element(By.ID, topic)
        topic_item.click()
    time.sleep(2)

摘要

摘要也是通过ID来获取的,代码如下:

    # 摘要
    summary = common_config['summary']
    summary_item = driver.find_element(By.ID, 'summary')
    summary_item.send_keys(summary)
    time.sleep(2)

tag标签

tag标签是一个输入框。所以我们先定位到这个输入框,然后输入tag,等待网站的tag列表出来之后,直接回车即可。

实现代码如下:

    # tag标签
    tags = cnblogs_config['tags']
    if tags:
        tag_item = driver.find_element(By.ID, 'tags')
        tag_item.click()
        for tag in tags:
            tag_input = tag_item.find_element(By.TAG_NAME, 'input')
            tag_input.send_keys(tag)
            time.sleep(1)
            tag_input.send_keys(Keys.ENTER)
    time.sleep(2)

提交文章

最后就是提交文章啦,这个提交按钮需要根据xpath来获取:

    # 提交文章
    if auto_publish:
        submit_button = driver.find_element(By.XPATH, '//button[@data-el-locator="publishBtn"]')
        submit_button.click()

总结

cnblogs的实现还是比较规范的,主要就是各项内容会比较多一些,需要耗费一些时间来实现。

点我查看更多精彩内容:www.flydean.com


flydean
890 声望433 粉丝

欢迎访问我的个人网站:www.flydean.com