Java开发网 |
注册 |
登录 |
帮助 |
搜索 |
排行榜 |
发帖统计
|
您没有登录 |
» Java开发网 » Java SE 综合讨论区
打印话题 寄给朋友 订阅主题 |
作者 | 用java语言如何能提出一个新闻页的时间、来源? |
fishman
发贴: 16 积分: 0 |
于 2005-04-28 14:03
想在一个html页面提取其发布时间、来源,但是其又不是一个纯html编码,如何实现?(我用的是htmlparser开源包) 例如查看页面:http://auto.163.com/05/0428/08/1IDPCB6E0008189H.html 中有: 柴油版覆盖一汽大众所有车 高尔夫出柴油版 汽车频道 http://auto.163.com 2005-04-28 08:58:37 来源: 北京娱乐信报 不良信息举报 发表评论 查看评论 在源码中,怎么分离出这里面的时间 以及 来源 ? 而内容在源码里面也有不少的< >括起来的东东,怎么滤掉? 还是另外有办法实现给出一个html就能抽出 时间、来源、内容? 谢谢 该网页源码见附件: 源码.txt (54.28k) |
话题树型展开 |
人气 | 标题 | 作者 | 字数 | 发贴时间 |
6096 | 用java语言如何能提出一个新闻页的时间、来源? | fishman | 364 | 2005-04-28 14:03 |
4719 | Re:用java语言如何能提出一个新闻页的时间、来源? | 铁针 | 8 | 2005-04-28 18:00 |
4818 | Re:用java语言如何能提出一个新闻页的时间、来源? | leowu2000 | 75 | 2005-04-29 08:40 |
4954 | Re:用java语言如何能提出一个新闻页的时间、来源? | fishman | 56 | 2005-04-29 14:33 |
已读帖子 新的帖子 被删除的帖子 |
Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1 客服电话 18559299278 客服信箱 714923@qq.com 客服QQ 714923 |