| JAVA实现数据采集程序基本原理 |
|
|
|
|
| 来源: 作者: 我容易么我 添加日期:2006-6-11 8:58:18 点击次数: |
|
项目需要,非要采集别人网站的MP3,没办法只能做。。好在成功了,分享一下心得。。 同样的方法,采集FALSH,文本都可以的。。 首先要采集别人的东西就要登陆别人的网页查看源代码找到下载地址,其实就这么简单。。 那就只要先定义一个方法让程序可以自动侦测到网页的源代码了。。 程序代码:
这个方法以网址为参数会返回那个网页的源代码,接着分析对方网页的超链接。。 凡是提供下载的必须提供链接,哈哈,废话。。我们只要根据网页源代码提取到超链接地址 然后村成TXT,直接用FLASHGET下载就行了 那么怎么分析出网页的超链接? 当然是用正则表达式了于是有了下面这个方法 程序代码:
接下来就是分析被采集网站的超接连归责,写出正确的正则表达式用上面的方法匹配出来 |
|
| |