昨晚有朋友发来问我关于上篇文章(大型网站Sitemap生成方法)关于如何将child-sitemap写入到main-sitemap中,这里主要是用到的站点地图协议sitemapindex!
sitemapindex主要包括以下几个标记!
<sitemapindex> – 文件头尾的父标记。
昨晚有朋友发来问我关于上篇文章(大型网站Sitemap生成方法)关于如何将child-sitemap写入到main-sitemap中,这里主要是用到的站点地图协议sitemapindex!
sitemapindex主要包括以下几个标记!
<sitemapindex> – 文件头尾的父标记。
Sitemap对我们大家来说并不陌生,稍懂SEO的人就知其作用!我们最常用的WordPress也有相应的插件来实现,但我个人觉得我们最常用的Baidu Sitemap Generator、Google XML Sitemaps等等插件生成机制并不是很是很完善!
原因为何?请看下文分解:
因为搜索引擎对sitemap其中的网址数目抓取有一定的限制,记得最早的时候,google对于一个sitemap只可以抓取1000个网址,后来才大幅增加!不管一个sitemap可抓取数量现在具体增加到了多少,但肯定数目的多少对搜索引擎的抓取肯定有影响,既然有影响我们为何不做得更完美一些呢!
今天完善开发了一下JAVA RSS生成程序,主要是对XML文件的操作!整理一下思路是这样的:
若XML文件不存在,则生成之
若文件存在,并且新文章与原有item不重复,将新文章内容插入之
删除文章,删除item
控制文章数目变量rssCount,超出该数值先删除最旧的item,然后再插入数据,保证生成数据的准确性。
昨天晚上研究比较了一下Jdom dom4j操作XML相关内容,jdom 与 dom4j 整个流程下来,个人感觉还是比较喜欢dom4j。
jdom很简单,但是他的操作方式不是很喜欢,jdom先把所有节点创建出来,在最后再将其关系组织起来,这样感觉如果节点过多的话会导致混乱;而dom4j的操作方式是从根节点开始,自上而下节点的创建与关系的组织井井有条!
在性能上来看,如果XML文件过大的话jdom会导致内存溢出,并且效率也不高;dom4j效率与性能上都很高,连Sun的JAXM也在用DOM4J。目前许多开源项目中大量采用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。
大项目用框架相对方便些,小一点项目还是不要用框架了太过复杂!
非框架时引用数据源我们一般这样:
Context ctx = new InitialContext();
DataSource ds = (DataSource)ctx.lookup(“java:comp/env/jdbc/MysqlDb”);
但看到有的地方是直接这样写的:
DataSource ds = (DataSource)ctx.lookup(“jdbc/MysqlDb”);