Posts Tagged ‘dom4j’

大型网站Sitemap生成方法

Friday, June 25th, 2010

Sitemap对我们大家来说并不陌生,稍懂SEO的人就知其作用!我们最常用的WordPress也有相应的插件来实现,但我个人觉得我们最常用的Baidu Sitemap Generator、Google XML Sitemaps等等插件生成机制并不是很是很完善!

原因为何?请看下文分解:

因为搜索引擎对sitemap其中的网址数目抓取有一定的限制,记得最早的时候,google对于一个sitemap只可以抓取1000个网址,后来才大幅增加!不管一个sitemap可抓取数量现在具体增加到了多少,但肯定数目的多少对搜索引擎的抓取肯定有影响,既然有影响我们为何不做得更完美一些呢!

Read More: 1002 Words Totally

dom4j为生成XML的文件添加xmlns属性

Friday, June 25th, 2010

今天在开发sitemap地图时遇到一个小小问题,就是xmlns属性的添加!我们知道sitmap 根结点有一些属性!大体如下:

1

2

3

Read More: 557 Words Totally

dom4j 删除XML节点

Thursday, June 24th, 2010

今天完善开发了一下JAVA RSS生成程序,主要是对XML文件的操作!整理一下思路是这样的:

若XML文件不存在,则生成之

若文件存在,并且新文章与原有item不重复,将新文章内容插入之

删除文章,删除item

控制文章数目变量rssCount,超出该数值先删除最旧的item,然后再插入数据,保证生成数据的准确性。

Read More: 557 Words Totally

jdom dom4j 操作XML

Thursday, June 24th, 2010

昨天晚上研究比较了一下Jdom dom4j操作XML相关内容,jdom 与 dom4j 整个流程下来,个人感觉还是比较喜欢dom4j。

jdom很简单,但是他的操作方式不是很喜欢,jdom先把所有节点创建出来,在最后再将其关系组织起来,这样感觉如果节点过多的话会导致混乱;而dom4j的操作方式是从根节点开始,自上而下节点的创建与关系的组织井井有条!

在性能上来看,如果XML文件过大的话jdom会导致内存溢出,并且效率也不高;dom4j效率与性能上都很高,连Sun的JAXM也在用DOM4J。目前许多开源项目中大量采用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。

Read More: 339 Words Totally


正在读取数据……