python获取富文本编译器内容里的文字和图片

无敌的宇宙
无敌的宇宙
擅长邻域:Java,HTML,JavaScript,MySQL,支付,退款,图片上传

分类: python 标签: html解析

2026-01-27 16:03:07 76浏览

python获取富文本编译器内容里的文字和图片
import re
from bs4 import BeautifulSoup

def getp(html_string,len=200):
    if html_string:

        # 使用BeautifulSoup解析HTML
        soup = BeautifulSoup(html_string, 'html.parser')
        # 提取所有文本内容
        text_content = soup.get_text()

        return text_content[:len]
    return None


def getimgs(html_string):
    if html_string:

        # 使用BeautifulSoup解析HTML
        soup = BeautifulSoup(html_string, 'html.parser')

        # 提取所有图片链接
        img_tags = soup.find_all('img')
        img_links = [img.get('src') for img in img_tags if img.get('src')]

        return  img_links
    return None

安装命令

pip install beautifulsoup4

好博客就要一起分享哦!分享海报

此处可发布评论

评论(0展开评论

暂无评论,快来写一下吧

展开评论

您可能感兴趣的博客

客服QQ 1913284695