关键词是SEO的核心概念之一,SEO实践中很多工作都围绕关键词开展。本文尝试从搜索技术原理和网站优化实践结合,总结内容页关键词布局在SEO中的具体落地方法。
一、搜索引擎技术原理简述
搜索引擎最核心的底层技术基础是将用户查询词切分成自然语言中有意义的词组,然后从索引库找到包含这些词组中全部或部分关键词的内容,返回结果。
正常人的搜索思路是带着关键词,去查找内容中是否包含该关键词。假设要从序号1-10的10个网页查找包含“关键词布局”的网页,分别去这10个网页中全文搜索是否包含“关键词布局”这个词,然后返回包含该词的网页的序号。但如果是从百万、千万个网页中查找呢,速度就很慢了,于是就发明了倒排索引的概念。(以下图中数据皆非实际数据,仅作示意)
如上图示,为一个最简单的倒排索引模型(DocID是搜索引擎为所抓取网页分配的唯一编号)。搜索引擎爬虫每次抓取一个网页的时候,就把网页切分成若干个词组,将这些词一一与倒排索引表比对:如果倒排索引表的“关键词”一列有这个词,就在其对应的倒排列表中增加当前网页的编号DocID;如果没有,就增加一行(涉及到新词识别,此处不展开),给这个关键词分配一个ID,再写入当前网页的编号。这样,当我们查询“关键词1”的时候,很快就能知道相关的网页有(1,2,3,5)。复杂一些的查询词假设被切分成“关键词1”、“关键词3”、“关键词6”这3个词,也能快速查询到相关网页有(1,2,3,5,6,7,9)。
仅仅这样,还不足以对搜索结果进行排序。非作弊的情况下,一个网页出现某关键词次数越多,该关键词越能代表此网页的特征,前提是要过滤停用词(停用词就是几乎每个网页中都有很多,但不能表达任何具体意义的词,比如:“的”、“是”、“了”等等)。如果我们能在倒排索引表里面加入关键词在网页中出现的频率信息(简称:词频–TF),就能对网页进行排序了。如下图所示:当我们的查询词被分词为“关键词1”、“关键词2”时,就能将相关网页排序为(3,5,1,2)。
假设现在有两个网页1、网页2,在倒排索引中的信息如下图:
我们搜索“关键词怎么布局”,搜索词被分词为“关键词”、“怎么”、“布局”,其中网页1中“关键词”、“怎么”、“布局”分别出现2、2、2次,共6次;网页2中“怎么”、“布局”共出现7次,按照前面的逻辑,最终的搜索结果排序为(2,1),这显然不是理想的排序结果,网页2的主题明显是讲“围棋怎么布局”的。此时需要引入IDF(逆文档频率指数)来解决这个问题。
如果一个网页集合中包含某个关键词的网页越少,则该关键词具有越好的网页区分能力,故IDF越大,即具有更高的权重。假设上图中的“关键词”、“怎么”、“布局”、“围棋”的IDF分别为2.5、0.3、0.8、3,每个词的TF乘以IDF后求和,得到网页1、2的相关性分别为:7.2、4.6,所以搜索“关键词怎么布局”的排序结果为(1,2),就比较符合实际了。
关键词的位置信息也是一个重点,一般认为标题中出现关键词比正文部分出现相同的关键词,更能体现一个网页的主题特征,H标签的重要性即在于此。搜索引擎还能够根据代码布局和噪音比例(如停用词出现频率)来判断哪里是导航、哪里是正文、哪里是侧边栏等等。在倒排索引列表中会把这些位置信息都标注进去,参与排序决策。
除此之外,还有一些其他的常用技术方法,如:双词索引/短语索引,“关键词怎么布局”不一定就是切分为三个短词,还可能切分成“关键词布局”、“词怎么”、“怎么布局”等等;关联词合并搜索,“关键词”的关联词“关键字”,“怎么”的关联词“如何”等。
当然,实际中现代大型搜索引擎的倒排索引模型会复杂很多,再融入其他诸多因素(一个重点是超链分析)参与排序算法,限于篇幅和作者水平有限,不继续展开了。
二、关键词如何布局
1、标题中一定要有关键词,但不一定要完整的疑问句
鉴于搜索引擎会把查询词切分为N多的单词、双词、短语,并在查询时加入关联词合并查询,所以标题中的关键词不一定是完完整整的一个疑问句,一个典型是“做XXXX哪家公司好”。标题中不一定需要这个完整的词,即使标题中包含了这个完整的短句,也不能匹配其他完整短句,一个优质的网页往往能匹配成百上千的长尾关键词,显然一个标题不可能全部包含。标题的另一大作用是吸引点击,点击率也是影响排名的一个因素,但其中的“XXXX”、“好”、“公司”这些核心词一定要出现。
2、正文自然、均匀的分布一些核心词和切分词
搜索引擎发展初期,很多技术人员利用TF*IDF算法权重较高的漏洞,大量堆砌关键词,从而快速获得较好的搜索排名。后来搜素引擎从算法层面修复漏洞打击作弊,就出现了网络上流行的“理想关键词密度3%~8%”的观点。首先,这个密度不是计算完整查询词的,而是切分后的词全部计算,并且实践中,你会发现有关键词密度稍微低于3%的,也有关键词密度高出8%很多的网页能够获得不错的排名。
如果你是搜索引擎的工程师,会怎么做?我想我会结合全网的历史访问数据(如百度统计、手机百度等都能获取较全面的访问数据)和关键词密度信息划定一个合理范围和警戒范围,超出警戒范围的给予沉默处理,在警戒范围区间的结合该站点历史数据和第一阶段的小流量排名的访问数据反馈,决定是打压还是维持或给予更高的排名。
相比于关键词密度,我们更应该注重的是语言的通顺流畅(一味地强插关键词显得啰嗦和别扭)和内容的质量深度。毕竟,搜索引擎的排序因素多达成百上千个,也不能顾此失彼。
3、正文下方相关内容和侧边栏推荐适当布局关键词
虽说搜索引擎能够通过代码和噪音比例判断这些不是正文部分,从而降低一些此处关键词的权重,但从百度快照缓存来看,还是有一点作用的。
正文下方和侧边栏的相关内容和推荐内容多是从横向和纵向两个角度选取内容。比如本文,主题是关于“关键词布局”,那横向推送一些“网站结构布局”、“关键词挖掘技巧”等站内优化方面的内容,大概率是有很多访客感兴趣的;纵向推送一些“教你怎么建设高质量的外链”、“如何提高着落页的转化率”等内容,也是访客可能暂时抑制的隐性需求。增加了关键词布局的同时,还能提高PV,降低跳出,提升用户体验,何乐而不为。
栏目热门
- 1Thinkphp5万能门店小程序独立版V2.42源码
- 2支付宝微信QQ收款码二维码合成三合一源码
- 3仿微信支付生活缴费小程序源码
- 4工业模具网站模板_响应式工业模具公司网站源码_模具公司网站定制
- 5包装袋设计公司网站模板|印刷包装制品企业网站源码
- 6【3.0新股申购】新增新股申购功能+独立新股管理后台+实时分时线和K线/配资系统源码
- 7园林业生态产品农业农庄农家乐建站模板
- 8律师法律事务所类网站织梦模板法务律师事务所
- 9电气空气净化设备网站织梦模板
- 10行业装饰品礼品工艺用品建站模板
- 11网页封装成苹果app和安卓apk的工具_电脑软件_软件工具 -
- 12loc大佬开发的荔枝个人发卡系统v1.0.0全网首发
- 13 wpay付费查看下载WordPress主题模板无限制版
- 14响应式艺考培训类网站织梦模板HTML5艺术培训机构
- 15WordPress主题最新多功能CMS主题lensnews免授权学习版
- 16Emlog html5视频播放器插件_emlog_插件模块_
- 17PHP软文发稿新闻文章发布自助推广平台源码
- 18手表眼镜电子设备机构产品建站模板
- 19H5手机转盘活动游戏页面源码
- 20 免费WordPress 自媒体图片展示行业视频博客主题源
- 21安卓Smart Tools v19.8专业版_手机软件_软件工具 -
- 22橙色机电设备产品企业站源码 织梦机械设备模板
- 23美甲美容美发化妆培训机构学校类企业织梦模板
- 24户外宠物用品各种宠物建站平台
- 25杰奇V2.2仿磨铁中文网二次开发版原创小说系统完整版网站源码下载
- 26PHP自适应个人即时到账收款平台网站源码 集成码支付微支付微信支付宝QQ支付接口
- 27家居家用产品床上纺织用品建站系统
- 28野生蜂蜜蜜蜂养殖类网站织梦模板(带手机端)
- 29 免费WordPress 二次元动漫酷站主题源码下载
- 30探果(简称tamguo)是基于java开发的在线题库系统
- 31小小素材库V7.8.43 原版 小程序前端+后端
- 32LED灯具机械工业类企业通用织梦模板
- 33【区块宠物】森林绿UI养殖收益理财区块链系统[签到+团队+实名]
- 34【仿小鸟云】最新IDC模板源码全新手机端已清后门
- 35QQ空间艾特网Java版源码+附教程
- 36工业环保工程类企业网站织梦模板(带手机端)
- 37 WordPress 响应式扁平化风格主题
- 38三国群英传OL[变态版]仿官方bt神将一键网单服务端送GM -
- 39响应式汽车零件配件设备类网站织梦模板HTML5响应
- 40最新S211【封神西游H5】一键端+教程+授权物品后台 -
- 41 免费WordPress 响应式资讯杂志流媒体主题源码下载
- 42绿色墙绘装饰设计公司网站织梦模板
- 43价值4500的国际版多语言点赞抖音分享点赞任务平台源码(十二种语言)
- 44玛塔留言板系统 v20191212
- 45PHP实物卡售卡商城系统源码 开源无授权无后门
- 46whmcs销售系统模板+购物车模板yousi_2021
- 47牛男网源码下载,92GAME制作帝国CMS7.0内核,资讯网站模板
- 48蓝色制冷机械设备织梦网站源码dedecms模板(带手机
- 49discuz仿手游控游戏论坛商业版网站模板源码
- 50火车头采集器V9无限制版本 火车头采集器V9.8企业破解版(全功能)_电脑软件_软件工具 -
联络方式:
电话:13388629007
邮箱:1030362387@qq.com