Java开发网 Java开发网
注册 | 登录 | 帮助 | 搜索 | 排行榜 | 发帖统计  

您没有登录

» Java开发网 » Java SE 综合讨论区  

按打印兼容模式打印这个话题 打印话题    把这个话题寄给朋友 寄给朋友    该主题的所有更新都将Email到你的邮箱 订阅主题
flat modethreaded modego to previous topicgo to next topicgo to back
作者 用java语言如何能提出一个新闻页的时间、来源?
fishman





发贴: 16
积分: 0
于 2005-04-28 14:03 user profilesend a private message to usersearch all posts byselect and copy to clipboard. 
ie only, sorry for netscape users:-)add this post to my favorite list
想在一个html页面提取其发布时间、来源,但是其又不是一个纯html编码,如何实现?(我用的是htmlparser开源包)

例如查看页面:http://auto.163.com/05/0428/08/1IDPCB6E0008189H.html

中有:
柴油版覆盖一汽大众所有车 高尔夫出柴油版
汽车频道 http://auto.163.com
2005-04-28 08:58:37 来源: 北京娱乐信报   不良信息举报 发表评论 查看评论

在源码中,怎么分离出这里面的时间 以及 来源 ?

而内容在源码里面也有不少的< >括起来的东东,怎么滤掉?

还是另外有办法实现给出一个html就能抽出 时间、来源、内容?

谢谢

该网页源码见附件:

源码.txt (54.28k)




话题树型展开
人气 标题 作者 字数 发贴时间
6096 用java语言如何能提出一个新闻页的时间、来源? fishman 364 2005-04-28 14:03
4719 Re:用java语言如何能提出一个新闻页的时间、来源? 铁针 8 2005-04-28 18:00
4818 Re:用java语言如何能提出一个新闻页的时间、来源? leowu2000 75 2005-04-29 08:40
4954 Re:用java语言如何能提出一个新闻页的时间、来源? fishman 56 2005-04-29 14:33

flat modethreaded modego to previous topicgo to next topicgo to back
  已读帖子
  新的帖子
  被删除的帖子
Jump to the top of page

   Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent
Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1
客服电话 18559299278    客服信箱 714923@qq.com    客服QQ 714923