Python语法进阶篇 -正则表达式的综合小练习

更新时间:2022-04-27 15:19:09点击次数:413次
匹配网址 url 的小练习
定义一个函数,判断 url 是否是一个正常的地址。
定义一个函数,只获取 url 的域名部分
import re
url_ture = "https://www.csdn.net/"
url_false = "ftp://110.110.110.110:8080"
def check_url(url):
    result = re.findall('[a-zA-z]{4,5}://\w*\.*\w+\.\w+', url)
    if not len(result) == 0:
        return 'url 是一个合法的网站地址'
    else:
        return 'url 是一个不合法的网站地址'
def get_url(url):
    result = re.findall('https://(\w*\.*\w+\.\w+)', url)
    if not len(result) == 0:
        return result[0]
    else:
        return []
if __name__ == '__main__':
    result_true = check_url(url_ture)
    print(result_true)
    result_false = check_url(url_false)
    print(result_false)
    result_url_01 = check_url("http://csdn.com")
    print(result_url_01)
    result_url_02 = check_url("https://www.csdn.com")
    print(result_url_02)
    get_url_true = get_url(url_ture)
    print(get_url_true)
    get_url_false = get_url(url_false)
    print(get_url_false)

执行结果如下:


 匹配邮箱地址的小练习
定义一个函数,获取邮箱的地址。
import re
email = "Neo@protonmail.com"
def get_email(email):
    # result = re.findall('[0-9a-zA-Z]+@[0-9a-zA-Z]+\.[a-zA-Z]+', email)      # 这样写比较复杂,可以使用通配符
    result = re.findall('.+@.+\.[a-zA-Z]', email)
    return result
if __name__ == '__main__':
    get_email = get_email(email)
    print(get_email)  
# >>> 执行结果如下:
# >>> ['Neo@protonmail.com']
 获取前端代码内容的练习
接下来做一个稍微复杂一些的练习:
定义一个函数,获取一段前端代码中双引号包裹的内容。
定义一个函数,获取该段前端代码中所有的双引号包裹的内容
import re
html = ('<div class="s-top-nav" style="display:none;">'
        '</div><div class="s-center-box"></div>') # 这是前端代码,暂时不用理解是什么意思
def get_html_data(html):
    re_g = re.compile('style="(.*?)"')      # 非贪婪模式获取 style 标签的内容
    # compile 函数会将这个匹配规则的字符串变成一个匹配规则的对象。接下来我们只需要调用这个对象去传入被匹配的字符串就可以匹配出来相应的信息了。
    result = re_g.findall(html)
    return result
def get_all_data_html(html):
    re_g = re.compile('="(.+?)"')
    result = re_g.findall(html)
    return result
if __name__ == '__main__':
    get_html_data = get_html_data(html)
    print(get_html_data)
    get_all_data_html = get_all_data_html(html)
    print(get_all_data_html)  
# >>> 执行结果如下:
# >>> ['display:none;']
# >>> ['s-top-nav', 'display:none;', 's-center-box']

本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责,本站只提供参考并不构成任何投资及应用建议。本站是一个个人学习交流的平台,网站上部分文章为转载,并不用于任何商业目的,我们已经尽可能的对作者和来源进行了通告,但是能力有限或疏忽,造成漏登,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息