2009年3月1日星期日

获取帖子标题(精简版)

import urllib2,re

f=urllib2.urlopen(
'http://bbs.cfan.com.cn/forum-53-1.html')

reg1=
u'\s*<span\s*id="thread_\d*"><a\s*href="thread-\d*-\d*-\d*\.html">(.+?)</a></span>'

for reg in re.findall(reg1,f.read()):

    
print reg

print '结束'

没有评论:

发表评论