检索词为:java
主要获得java的相关检索词和上升最快相关检索词。获得相关的百分比
package cn.com.htmlparser.use; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.HasAttributeFilter; import org.htmlparser.tags.Span; import org.htmlparser.tags.TableColumn; import org.htmlparser.tags.TableRow; import org.htmlparser.tags.TableTag; import org.htmlparser.util.NodeList; import org.htmlparser.util.ParserException; public class BaiduZhishu { /** * @author rrong_m * @param args * @throws ParserException */ public static void getXiangguan(String url) throws ParserException//相关检索词 { Parser parser=new Parser(url); parser.setEncoding("gb2312"); NodeFilter filter=new HasAttributeFilter("style","margin-left:10px; float:left"); NodeList nodelist=parser.extractAllNodesThatMatch(filter); NodeList n1=P(nodelist.elementAt(0).getChildren(),"class","tdkeyr"); NodeList n2=P(nodelist.elementAt(0).getChildren(),"class","bar"); for(int i=0;i<n1.size();i++) { System.out.print(n1.elementAt(i).toPlainTextString()+"||||"); Node node=n2.elementAt(i); if(node instanceof Span) { Span s=(Span) node; String temp=s.getAttribute("style"); System.out.println(temp.split("%")[0].split(":")[1]); }//获得百分比。。 } } public static NodeList P(NodeList nodelist,String a,String b) { NodeFilter filter=new HasAttributeFilter(a,b); nodelist=nodelist.extractAllNodesThatMatch(filter, true); return nodelist; } public static void getShangSheng(String url) throws ParserException//上升最快的检索词 { Parser parser=new Parser(url); parser.setEncoding("gb2312"); NodeFilter filter=new HasAttributeFilter("style","margin-left:10px; float:right"); NodeList nodelist=parser.extractAllNodesThatMatch(filter); if(nodelist.size()>0) { Node node=nodelist.elementAt(0); if(node instanceof TableTag) { TableTag table=(TableTag) node; for(TableRow tr:table.getRows()) { String temp=""; for(TableColumn tc:tr.getColumns()) { temp=temp+tc.toPlainTextString(); } System.out.println(temp); } } } } public static void main(String[] args) throws ParserException { getXiangguan("http://index.baidu.com/main/word.php?word=java"); getShangSheng("http://index.baidu.com/main/word.php?word=java"); } }
分享到:
相关推荐
htmlparser解析API,希望对解析代码的伙伴们有帮助
htmlparser解析html,获得需要的字段
使用HTMLParser解析网页,找出文章后下载保存
使用HtmlParser 提取百度贴吧中的图片
htmlparser是一款小而强大的解析Html 的第三方工具包,内含jar包和源文件包(两个),htmlparser1.6.jar,htmlparser1.6_src.jar,非常有用的
如何在Java程序中利用正则表达式实现对字符串的解析.另外,HTMLParser是一款很强大的对HTML网页进行解析的工具,其中大量地用到正则表达式.
标题已经哼明白了,这里下载下来作为library引入即可。 这里是jar下载:http://sourceforge.net/projects/htmlparser/ (ps:不过导入jar前,要重新编译jar,要不在Android工程了不可用)
htmlparser(HTML页面解析)例子
HTMLParser HTML解析 HTMLParser HTML解析 HTMLParser HTML解析
Html解析助手htmlparser.jar。Html解析助手htmlparser.jar
用htmlparser解析html的所有jar包,非常全!
NULL 博文链接:https://sunfish.iteye.com/blog/1317467
htmlparser 解析wap页面可用
按DOM模型解析html文件的工具包 已下是源码列表: META-INF/MANIFEST.MF META-INF/maven/org.htmlparser/htmlparser/pom.properties META-INF/maven/org.htmlparser/htmlparser/pom.xml org.htmlparser.Parser.class ...
HtmlParser.Net是来源于Java的一个用来解析html的组件,主要用于改造或提取html。它能够高速解析html,是非常好的一个html解析和分析工具。 这个是.Net版本包括源代码和帮助文档。 版本:HTMLParser.Net - Community...
HtmlParser解析器所要用到的所有包文件,加载到工程文件中可以直接使用
基于java的开发源码-HTML文档解析器 HTMLParser.zip 基于java的开发源码-HTML文档解析器 HTMLParser.zip 基于java的开发源码-HTML文档解析器 HTMLParser.zip 基于java的开发源码-HTML文档解析器 HTMLParser.zip 基于...
java htmlparser 解析网页源码
htmlparser[1]是一个纯的java写的html(标准通用标记语言下的一个应用)解析的库,它不依赖于其它的java库文件,主要用于改造或 提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。 毫不...