今天写代码遇到一个问题,明明写的正则表达式没问题,但是程序匹配不出来,但是用编程助手却又能匹配出来,百思不得其解。后面在程序中把返回的源码打印出来,发现返回的HTML代码中的<table>是大写的,而我的正则表达式中是小写的。于是猜想到,应该是大小写的问题,经过百度解决了这个问题:
content1_obj=re.compile('''<table([\s\S]*?)</table>''',re.I) #re.compile是预加载正则表达式,采集table, re.I代表忽略大小写:https://www.runoob.com/python/python-reg-expressions.html#flags
如上所示,默认的代码re.compile是区分大小写的,要在第二个参数中,加上“re.I”才能不区分大小写。这个参数如果省略就是区分大小写!更多内容,可以参考上面的引用链接。
标签: 正则表达式