搜索引擎
收录情况
反向链接
百度
391,000
5,630
谷歌google.cn
249,000
1,490
site:www.tejiawang.com/*
13,800
google.com
887,000
1,480

近日与特价王的杨总有些交流,他很希望有什么办法可以提高特价王的搜索引擎收录量。
 
于是我花了一些时间进行了诊断分析,一些常规优化的细节或方法就此省略。
 
1.         302转向问题。
在百度执行Site:www.tejiawang.com 有相当一部分搜索结果打开后(附图),直接跳转到首页,经过URL 重定向检测,这些页面做的是302转向。302转向是对搜索引擎不友好的处理链接方式,有可能被搜索引擎认为是可疑的作弊手法,不是搜索引擎友好的 URL 重定向链接,建议修改重定向回应值为 301
在谷歌执行site:www.tejiawang.com没有出现跳转类型页面收录结果,估计谷歌已过滤。
在谷歌执行site:www.tejiawang.com/* 可得到不是补充材料的页面收录量。
不是补充材料页面只占总收录数的6%
 
2.         页面相似度。商品页面占整个网站比重较大,以此做随机测试较为有代表性。
1)        随机抽取3组两大类商品的分类页进行测试对比,相似度如下:

组别
相似度
通讯、IT数码
62%
电脑、电脑配件
77%
图书、婴幼儿用品
46%

 
2)        随机抽取3组某大类商品下两个不同子类列表页进行测试对比,相似度如下:

组别
相似度
通讯(手机、通讯配件)
67%
礼品(手表、儿童礼品)
69%
办公用品(激光打印机、办公家具)
70%

 
3)        随机抽取3组同一商品子类下不同品牌的两个列表页进行测试对比,相似度如下:

组别
相似度
手机(诺基亚、多普达)
68%
MP3播放器(苹果、三星)
83%
经济与管理(经济理论、管理学)
73%

 
4)        随机抽取3组同一商品子类下的任意两个详细内容页进行测试对比,相似度如下:

组别
相似度
图书
75%
手机
77%
车内装饰
76%

 
5)        随机抽取1个单样商品下的任意2个内容页进行3组测试对比,相似度都如下。

组别—佳能IXUS 75
相似度
网店报价
39%
网店报价
90%
90%

         随机抽取测试某类商品主要几级页面,文本内容比例如下:

页面
统计数据
商品大类:IT数码
www.tejiawang.com/sort_2.html
页面数据大小:
51,898 字节 = 51 K
HTML 代码大小:
46,046 字节 = 45 K
文本内容大小:
5,852 字节 = 6 K
文本页面比:
11.28 %
页面数据大小:
57,667 字节 = 56 K
HTML 代码大小:
50,714 字节 = 50 K
文本内容大小:
6,953 字节 = 7 K
文本页面比:
12.06 %
页面数据大小:
52,753 字节 = 52 K
HTML 代码大小:
46,631 字节 = 46 K
文本内容大小:
6,122 字节 = 6 K
文本页面比:
11.61 %
具体型号:佳能 IXUS 65
www.tejiawang.com/
pricecompare_a_31466.html
页面数据大小:
45,778 字节 = 45 K
HTML 代码大小:
41,428 字节 = 40 K
文本内容大小:
4,350 字节 = 4 K
文本页面比:
9.50 %

              综上测试数据所得,同类型或相关类型商品的页面相似度较高。同一产品相关页面正文内容越少,相似度越高。
模板代码占页面整体比例过高,主体文本内容比例过低。搜索引擎对网页相似度限制在 60%,如果超过这个标准会判断为大量的相似页面,甚至是重复页面,将导致页面不被搜索引擎收录,或者收录后排名靠后。

解决建议:
1)        大规模增加正文内容,最短也应该在200字左右以上(需要视模板代码的具体比例而定)。
2)        调整各级页面模板,JS优化(把大量JS代码或相似度高的内容采用JS文件形式调用)可将模板代码比例降低。
 
 
3.         虽然特价王已采用DIV+CSS构建,但随机测试多个页面都没通过W3C的验证。通过W3C的验证的HTML代码能够使搜索引擎的Spider更容易地收集网站页面的内容信息。
但调试一个大型网站的所有代码,使其符合W3C标准,也不是一件很轻松的工作。
 
由于网站先天的主体页面内容都是采集或读取对应网站的数据,无法让搜索引擎索引到喜欢的原创内容,所以在内容主体上没有优势,要想获得更多搜索引擎关注,则需要不断扩大网站本身知名度:持续高质量外链的建设,扩大在媒体的曝光度(新闻稿、软文)。

特价王外链质量分布情况如下,常规中等PR数量较少,无6以上高PR。

PR
数量
5
3
4
23
3
41
2
31
1
37
0
854

 
搜索“网上购物、商品导购、比价购物”
在百度谷歌均排名前列的某比价购物网站外链质量分布情况:
PR
数量
7
1
6
3
5
35
4
72
3
103
2
68
1
45
0
436
 

通过以上几个调整,相信特价王可以增加收录量。