一头乱码's OffIcE: 获取帖子标题(精简版)

2009年3月1日星期日

获取帖子标题(精简版)

import urllib2,re

f=urllib2.urlopen('http://bbs.cfan.com.cn/forum-53-1.html')

reg1=u'\s*<span\s*id="thread_\d*"><a\s*href="thread-\d*-\d*-\d*\.html">(.+?)</a></span>'

for reg in re.findall(reg1,f.read()):

    print reg

print '结束'

没有评论:

发表评论

订阅：博文评论 (Atom)