简介
之所以要了解SEO这方面的内容,一方面是因为自从建立了这个博客页面,与网站相关的方方面面都需要自己来操办,SEO便是其中的一部分。另一方面,了解SEO有助于我去了解搜索引擎的工作机制,以及数据是如何配合搜索引擎,来提高自己被召回的机会的。
本站作为一个个人博客,一般并不需要通过书中提到的种种手段来提升排名,感觉一些手段对于一个个人博客而言有些用力过猛了。所以,下文中提到的种种手段,仅作记录,学习用途,我懒得在自己的博客网站上实践。
以下的笔记内容均以网页作为搜索目标来描述,暂不考虑垂直领域的数据。并将注重网页生产方是如何通过丰富自身内容,以及配合搜索引擎来实现SEO的,弱化搜索引擎的工作原理,以及实际业务相关内容。
搜索引擎基础
搜索引擎通过爬虫获取网页数据,提取有用的信息后构建索引,整合到搜索算法中。
排序系统
搜索引擎得到用户的输入后,便开始计算自己所有的页面中可被召回的页面。进而再根据数据的与用户输入的相关度以及受欢迎程度来进行排序。
前面提到的从网页中提取的有用的信息,在这里进行排序时便用上了。当然,最核心的影响到相关度的自然是页面的实际内容。其他的比如页面的关键词标签,说明标签,导航栏信息等。
搜索意图确认
这里提到的意图不单单指的是根据用户的输入信息推测出来的用户意图,同时也指如何根据用户的输入信息,推测出最符合用户意图的页面。
一方面,搜索引擎需要根据用户的搜索词与页面内容进行匹配,其中便涉及到自然语言的处理,比如同义词以及词汇歧义等。另一方面,搜索引擎要能够在众多满足用户意图的页面中挑选出最合适的返回给用户,于是它做了一个链接分析的工作,不同的页面之间相互引用,可以简单的认为,被其他页面引用的越多,页面的价值越高。
影响排名的因素
影响排名的因素有很多,除了最基本的页面本身的内容外,还有很多其他的因素。正面的因素有标题标签中的关键词,导入链接的介绍文字,网站的相关指标等。负面的因素有网页经常无法被搜索引擎爬虫访问,页面中的内容与别的页面重合度过高,重复的标题或者标签关键词。
垂直搜索引擎
垂直搜索指的是针对某个领域内的数据进行的搜索,比如图片,视频,博客,购物,地图等。
在07年时搜索引擎做了一些改动,将上述的垂直搜索结果整合到了目前已有的网页搜索中,新的搜索工具又叫整合搜索。所以这就是我们今天看到的在线搜索的模样?
确定目标,定义受众
设定SEO的目标
与其说是目标倒不如说是SEO的效果。提升品牌价值,提高网站流量,提高投资回报率。
确定SEO的场景及受众
不同的场景,不同的目标人群,决定了不同的SEO方法。
不同的场景,上面提到了SEO的各种效果,这里的场景,也就是为了达到不同的效果,而采取对应的手段。如果是为了原始流量,那么就需要准备优质内容,而并不需要针对特定关键词做优化;如果是为了名誉管理,换个说法就是个人或者公司的身份,需要借助社交媒体,新闻发布等手段。
不同的人群,可能是性别不同,或是年龄,行业,地区不同,在搜索同一个事物时,有着不同的搜索习惯,会用上不同的搜索词。
SEO的准备流程
网站信息架构
网站的架构如果设计的过于复杂,而导致搜索引擎的爬虫难以读取,会对SEO有较大的负面影响。
技术层面需要注意的点有:避免动态URL,注意对用户的跟踪手段,注意URL中的无用符号,注意基于JS的内容加载,注意表格,下拉菜单等手段的内容隐藏。
结构层面需要注意的点有:确定网页的关键词,注意相关内容的交叉链接,注意锚文字的使用,减少链接的深度。
上述的要求并不是不推荐使用,而是需要尽量注意在使用这些技术后,权衡对SEO所带来的影响。
服务器分析软件
我们需要通过软件来分析自己的网站,了解到自己的网站的详细信息,例如每天的访问量,通过什么搜索词找到了自己的页面,网站上的热门页面等。可以通过分析网站的日志文件来实现上述的功能,也可以借助现有的工具,例如Google和Bing的网管工具。在后面的章节会详细了解这样的工具。
关键词研究
确定关键词价值
文章里有句关于关键词的解释说的好,挺适用于我的个人博客的:
有多少搜索这个词的人来到你的网站,然后失望地离开?
所以,合适的SEO应当是忠于自身内容的,而不是单纯的为了流量不择手段的去优化。
关键词需求的长尾效应
文章里提到70%的搜索查询包含在长尾里,针对这部分做优化或许会更加容易一点,更容易看到效果,毕竟很多人在为了热门关键词去做优化。文章里给出了对长尾关键词的优化方法,从中也可以看出作者对搜索引擎的相关度算法原理的理解:
- 从你的关键词研究中提取处于分布曲线头部的10~50个最常用的搜索词;
- 在Google,雅虎,Bing中搜索这些关键词;
- 对前10~30个结果中的每一个页面,提取页面上的独特的文字内容;
- 剔除停用词,然后用词组长度过滤;
- 剔除在你关键词研究数据库中已经存在的词和词组;
- 将剩下的词按照常见度排序,梳理。
通过上述流程得到的长尾关键词,便是较为容易优化的点。
SEO友好
这里面将上面提到的各种SEO手段进行了汇总:
- 通过XML网站地图优化爬虫的访问效率;
- 优化信息结构,分类结构;
- 网站整体架构要扁平;
- 注意JS对爬虫获取页面数据的影响;
- 注意子目录,子域名等涉及到URL的因素的影响;
- 优化URL中的文本,保持言简意赅;
- 优化关键词,标题标签等;
- 优化图片,视频等的文件名及标签;
- 避免与别人重复的内容;
Google Search Console
无论是 Google Search Console 还是 Bing Search Console,都是用来帮助站长更好的管理自己的网站的,一方面,站长可以为搜索服务提供商提供关于站点的更加详细的资料;另一方面,站长可以通过这样的工具,了解到自身站点的详细信息,例如sitemap,点击率,检索词之类的。
在上面提到的种种SEO手段中,经常会提到一些数据的获取,例如想要提取到进入站点的最常用的搜索词,在 Search Console 中便可以轻松的得到。
站点SEO插件的理解
目前我的博客上用的SEO优化的插件是Rank Math,因为这个插件是在免费的前提下,我能找到的功能最全的了。插件罗列了很多的设置参数,并且为每一篇文章提供了SEO的建议及评分。
就以当前的这篇文章为例,插件会自动生成这篇文章在搜索结果里的样式,并提示我需要填写哪些字段,来优化展示效果。也包含了很多的检查项,比如“Focus Keyword does not appear in the SEO title.”,“ Your content is 90 words long. Consider using at least 600 words. ”。我懒得为了这些指标去做优化了。
当然,这些指标也从侧面反映了插件开发人员对搜索引擎相关度算法的理解。或许,当我在开发一个搜索引擎,需要计算相关度时,这些指标我也可以考虑考虑?