SEO笔记


SEM=搜索引擎营销
PPC/CPC=关键词广告
PPC=pay per click
CPC=cost per click

SEO=搜索引擎优化
主流搜索引擎:
百度 https://www.360docs.net/doc/8e1761394.html,
搜狗 www.cogou
搜搜 https://www.360docs.net/doc/8e1761394.html,
有道 https://www.360docs.net/doc/8e1761394.html,
Google https://www.360docs.net/doc/8e1761394.html,
yahoo https://www.360docs.net/doc/8e1761394.html,
Bing https://www.360docs.net/doc/8e1761394.html,
360 https://www.360docs.net/doc/8e1761394.html,
中国信息网 https://www.360docs.net/doc/8e1761394.html,/


电子商务:广义:网络,手机,电视,广告,传真,物流,仓储,

狭义:网络上买卖商品
模式:
企业对企业:B2B=business to business 阿里巴巴,慧聪网,

企业对个人:B2C=business to customer 京东,B2B2C=天猫,凡客,1号店,当当,亚马逊

个人对个人:C2C=customer to customer 淘宝,ebay

电子政务:
G2G=政府对政府
G2B=政府对企业
G2C=政府对个人

O2O=online to offline 团购
offline to online

一 爬行和抓取:
吸引蜘蛛:权重高,更新快/多,导入链接,首页距离近

地址库:避免重复,而建地址库,记录被发现还没被发现的,和以被抓取

文件存储:蜘蛛抓取数据存入原始页面数据库

爬行时的重复内容检测:抓取中也进行,一定内容检测,权重低的站如果大量转载或抄袭,可能不在继续爬行

优化:发布外链,搜索引擎后台提交

二 预处理(索引)

目的:分析抓取来的页面中的信息

过程:
1 提取文字--提取出用于排名的内容文字:

2 中文分词--基于字典匹配,另一个是基于统计:

3 去停止词--中文的,地,得,英文a the等:

4 消除噪声--版权声明,导航条,广告,文章分类等

5 去除重复--相同内容在不同网站和同站不同网址上:

6 正向索引--按照页面内容分词并建立索引文件:

7 倒排索引--一关键词为索引建立索引文件:

8 链接关系计算--页面导入和导出链接数量:

9 特殊文字处理--可处理pdf,word,wps,不能处理图片,视频,flash,脚本程序。

优化:页面包含用户搜索词

三 排名:

目的:将相关结果显示给用户

过程:搜索词处理 分词 去停止词 匹配倒排索引 初始子集 相关性计算 排名过滤 显示 缓存预处理 记录用户行为

优化:提高相关性,提高用户体验

1 搜索词处理 故宫的正门是那个门

2 文件匹配 关键词匹配倒排索引文件

3 初始子集的选择 百度76*10 google100*10,页面权重为主要依据

4 相关性计算 关键词密度2%-8%,位置,链接,权重

5 排名过滤及调整 过滤作弊信息,调整排名

6 排名显示 调用原始页面的标题标签,说明标签,快照日期等数据

7 搜索缓存 常见的搜索词存入缓存,直接调用

8 查询及点击日志 记录用户搜索信息



关键词布局顺序:
从左到右

从上到下

A-->B<--C

四 搜索结果显示方式
1 缩进列表
2 全站链接
3 0ne-box
4 富摘要
5 面包屑导航
6 预览
7 品牌
8 百度应用

搜索引擎的分类
全文索引 google,百度
目录索引 yahoo,sina的分类目录,
元搜索引擎

集合石搜索引擎
门户搜索引擎
免费链接列表


高级搜索指令:
查询网站收录量:site:https://www.360docs.net/doc/8e1761394.html, 不加www
查询网站外链数量:domain:https://www.360docs.net/doc/8e1761394.html, 百度
link:https://www.360docs.net/doc/8e1761394.html, 谷歌
百度站长工具:https://www.360docs.net/doc/8e1761394.html, 查询较准确
查询特定格式文件:filetype:doc 建站方案
查询竞争对手网站:related:https://www.360docs.net/doc/8e1761394.html,
"关键词"完全匹配
* 通配符 查新长尾词
inurl:关键词
inrtitle:关键词
PR值:佩琪等级 page rank
0-10级,级别越高表示网站权重越高
网站首页PR代表 整站的PR
A-->B-->C-->D
5 6 3
PRd=(PRa/Ca+PRb/Cb+……+PRn)*d+(1-d)
d=0.85

网站A PR=8 导出12 8/13*0.85+0.15
提高PR值:
自己网站外链导入越多越好
自己网站导出越少越好
对方网站PR越高越好
对方网站导出越少越好
相关的网站做链接

衡量网站的相关数据:
1.百度权重:关键词指数,百度里面的排名,能够预计带来的流量来计算百度权
查询:https://www.360docs.net/doc/8e1761394.html, 站长
2.alexa排名:根据网站流量排名
查询:https://www.360docs.net/doc/8e1761394.html,
3.网站收录:反映:搜索引擎是否喜欢网站内容(收录总量,速度,比例,稳定性)
查询:site:https://www.360docs.net/doc/8e1761394.html,
https://www.360docs.net/doc/8e1761394.html,
提高:更新内容
4.百度快照:蜘蛛抓取时间
反映:蜘蛛的抓取频率
查询:site:https://www.360docs.net/doc/8e1761394.html,点击百度快照
提高:链接,规律更新
5.外链:反映:网站的权重
查询:link和domain或https://www.360docs.net/doc/8e1761394.html,
提高:发布高质量外链
6.死链:无法找到资源文件,蜘蛛陷阱,用户体验差
检测:XENU
处理:去掉死链接
做404页面
提交死链
7.PR值:反映网站权重
衡量依据:网站的外链数量和质量
查询:站长工具
提高:
8.关键词排名:

用户规模:百度指数网址:https://www.360docs.net/doc/8e1761394.html,

百度推广网址:https://www.360docs.net/doc/8e1761394.html,

爱站网网址:https://www.360docs.net/doc/8e1761394.html,

排名榜网址:https://www.360docs.net/doc/8e1761394.html,

潜在流量:百度推广关键词规划师,金花

竞争度分析:百度指数,"",inurl,intitle,搜索结果URL

百度指数:用户规模
竞争度
广告投放时段作为参考
和网站流量对比,排查问题

域名分析:
类型:由后缀
org,gov,edu,com
长度:越短权重比较高

时间:注册:注册时间越久信任度越高
老域名积累了权重,有一些外链,查询-万网新网等代理商
到期:到期时间久信任度较高
指向:不要频繁解析到不同的空间
含义:体现网站的内容
产品,业务,服务,品牌
(拼音,单词,缩写,混写,谐音,数字)

链接:内链:内部连接,同一域名下的不同页面间链接
外链:不同域名间的网页链接
导入/反向:别人给我做链接 A-->B (B获得导入链接)
导出: (A导出链接)


收录总量:被搜索引擎收录的页面总量
反映搜索引擎是否喜欢网站
查询:site:https://www.360docs.net/doc/8e1761394.html,
提高:更新数量,质量

收录速度:反映蜘蛛访问频率
查询-site:https://www.360docs.net/doc/8e1761394.html, 百度快照
提高:更新频率,质量
收录比例:收录量/网站页面总量
查询:site命令/XENU总量
提高:更新质量,频率
收录稳定:长期跟踪记录收录总量
浮动过大说明搜索引擎信任度低

======================================================================


关键词选取策略:

词频:出现次数
密度:关键词次数/页面总词量 (2%-8%)
布局:title,description,body (从上到下,从左到右),keywords

权重标签:

一级标题,文字主标题,文章页

级别最高

二级标题,导航(次导航,面包屑导航),内容页/栏目页


三级标题,相关新闻,文章页,


关键词
关键词
关键词
关键词
关键词
关键词

连接权重

用户行为
_________________________________________________________________
_________________________________________________________________

关键词选取原则:
1.相关性强:关键词与网站内容相关
从网站内容出发选择关键词
产品,业务,服务,品牌
2.搜索量大的词:用户规模大,带来流量比较多
百度指数
3.竞争度小:容易优化
百度指数,intitle,inurl, 搜索结果URL
4.转化率高:用户搜索意图判断

===================================================================
3
花店
名称:花无缺花店
产品:各种鲜花

1.确定产品:鲜花,花篮

业务:婚庆鲜花,店里鲜花,开业鲜花,庆典
服务:配送,预定
品牌:花无缺
2.客户:年龄:25-45
地域:附近3公里
性别:不限
职业:老板 ,职业
行业:婚庆,演绎,餐饮,服饰
活跃时间:上班时间
3.发掘关键词:
产品词

:玫瑰,百合,康乃馨……
业务词:婚庆鲜花,店里鲜花,开业鲜花,庆典,花篮
服务词:鲜花配送,鲜花预定,网上订花……


开业花篮,生日鲜花,北京鲜花批发,北京鲜画速递


对手
百度长尾词:
1.搜索下拉框
2.搜索结果下面底部相关搜索
3.百度指数里面的,需求图谱,相关词分类
4.百度推广关键词规划师

关键词,3-5个词,字符数量不超过40个汉字,分词符-,_|,





核心:主推词
为网站带来80%流量
从网站内容出发+用户搜索量
长尾词:次要的词
词量多,竞争度低,为网站带来的流量多少
从用户搜索习惯发掘

关键词布局:
核心词-首页(title,description,keywords,body)
长尾词-栏目/内容页(title,description,keywords,body)

==========================================================
步骤:
了解企业/网站的内容
分析用户的需求,搜索习惯
分析数据(搜索量,竞争度)
确认核心关键词
部署到网站各个页面
===========================================================
robots.txt(蜘蛛协议)
协议文件:提示蜘蛛抓取的内容
放置位置:更目录
区分大小写
https://www.360docs.net/doc/8e1761394.html,er-agent:Baiduspider(spider 蜘蛛程序)
Allow:/a/
Allow(允许):/about/(目录要分开写,不能写在一起)
Disallow(禁止抓取网站任何内容):/
Disallow:/templets/
Disallow:/plus/

https://www.360docs.net/doc/8e1761394.html,er-agent:Baiduspider
Allow:/ (允许所有内容)

Disallow:/ (/禁止所有内容,不加/允许所有内容)

https://www.360docs.net/doc/8e1761394.html,er-agent:Goolebot
Disallow:/

https://www.360docs.net/doc/8e1761394.html,er-agent:* (针对所有蜘蛛程序)
Disallow:/
Disallow:*.jpg$ (针对文件要用$结尾)

https://www.360docs.net/doc/8e1761394.html,er-agent:* (针对所有蜘蛛程序)
Disallow:/
Sitemap:https://www.360docs.net/doc/8e1761394.html,/sitemap.xml

Sitemap文件:网站地图(网站页面地址)
作用:罗列出网址地址,让蜘蛛抓取更快速,方便
如何建立:使用sitemapbuilder
放置位置:根目录
名称:sitemap.xml
提交sitemap:
1.在robots.txt声明(比较被动,蜘蛛不来抓取的话,无法访问sitemap)
2.在百度站长后台提交(主动提交)
主动推送:将网站内容实时推送给百度,收录效率更高
方法:在百度站长后台-链接提交-自动提交-主动推送
将php代码放到,文件存为tuisong.php,上传到更目录(推送网站不要重复提交,否则会降低推送的网址数量)

=============================================================
蜘蛛陷阱:

flash,各种跳转(有欺骗行为),sessionID,要求登录,强制使用cookie,框架结构
==============================================================
http状态码
1** 请求发送当中
2** 成功访问
3** 跳转/定向 301-永久跳转
302-临时跳转
4** 用户端错误 404-无法找到对应的资源文件
5** 服务器端错误

空间域名优化:
构成:http:https://www.360docs.net/doc/8e1761394.html,
协议 二级域名 主域名 后缀
合法字符:数字,英文,-
长度:1-63(越短越好,不建议超过11个)
类型:由后缀决定
.com营利性组织 .net互联网组织 .org非盈利组织 .gov政府组织 .edu教育组织
地域划分 国家级域名 .cn .tw .hk .jp
含义:体现出网站的内容
产品,服务,业务,品牌
(拼音,单词,缩写,混写,谐音,数字)
时间:注册时间:注册时间越久,搜索引擎的信任度越高
老域名(积累了一定的权重,有外链)
查询:https://www.360docs.net/doc/8e1761394.html,
到期时间:到期时间越久搜索引擎信任度越高
指向:不要频繁解析到不同空间和网站上

==================================================================================
空间:存放网站数据的服务器
类型:独立主机-一台独立的服务器-安全,权限较高
费用高,技术要求高
虚拟主机-一台服务器划分出多个空间-价格低
技术要求低,安全性差,多个公用同一IP

VPS-虚拟独立知己-独享IP,数据库,宽带
(各网站间无关联)
云主机-价格适中,存储量大,处理速度快
=======================================================================
配置:操作系统-Windows,Linux
web服务器-IIS,Apache
数据库-SqIServerMySQL
语言-jsp,asp,PHP
容量-空间大小;流量;带宽(共享,独享);IP(共享,独享);接入方式(单线,双线,多线);并发数(同时处理请求的数量);稳定性,良好的共处环境;

-------------------------------------------------------------------------
网站内链优化:根据主域名判断
内链:网站内部链接;同一域名下的不同页面间的链接

网站导航:主导航,次导航,面包屑导航,网站地图

1.主导航-网站内容大的分类
所有页面顶部
可以识别的锚文本链接
使用关键词作为栏目名称(关键词布局)

-----------------------------------------------------
2.次导航-网站内容细致分类
出现在页面顶部,左侧,底部,下拉列表
使用可识别的锚文本
关键词作为次导航栏目名称


-----------------------------------------------------
3.面包屑导航-内容页/栏目页上方
提示用户目前所处的位置
使用关键词锚文本链接
层级3层之内

------------------------------------------------------
4.网站地图-引导用户和蜘蛛抓取的一个html页面
放在根目录,在首页头部做链接
------------------------------------------------------

排行榜-打破现有网站栏目和内容分类,将不同类别的内容划分到一起
排序规则-最新新闻,热门新闻(点击量,回复量)
位置-首页,栏目,内容页侧边

=============================================================
网站结构

1.逻辑结构:网站页面间的链接关系--内链
扁平结构-所有页面在首页做链接
好处-1.层级浅用户点击方便
2.利于蜘蛛抓取
3.首页权重直接传递到页面
适合小型企业网站
坏处:
树形结构-分类链接,首页-栏目-子栏目-内容页
好处-1.内容分类利益用户的访问
2.内容较多利于后期的维护管理
3.利于权重传递到主栏目
适合中大型网站
坏处:

2.物理结构:网站文件实际存放的位置
扁平结构:所有文件直接放到根目录
适合小型网站
好处-1.文件层级浅,提高网页的权重
2.
坏处-

树形结构:网站的文件分类放到不同的文件夹中(层级不要超过三级)
适合大中型网站
好处-利于管理和优化

===================================================================

网站页面间的链接关系
首页:栏目,重要内容
栏目页:首页,其他栏目,该栏目下的内容
内容页:相关新闻,其他栏目,首页

====================================================================

内链对网站权重的影响
首页权重7
栏目页权重6
子栏目权重5
内容页权重4
网站多入口,利于网站收入
相关产品链接:根据关键词判断相关性
锚文字分布及变化:超链接,关键词分布变化
nofollow 屏蔽权重:
联系我们
深层链接:重新抓取链接

=====================================================================
URL优化:
URL:统一资源定位器/网址
https://www.360docs.net/doc/8e1761394.html,/2016/08/02/ARTIcRXYSj8vQdtjVkTXG5Ue160802.shtml
构成:资源类型+空间地址+端口+路径+文件名.格式
长度:所有字符总和,不超过80个字符
层级:放的物理结构层级,路径不超过3级
含义:域名+路

径+文件名(包含关键词拼音,单词,缩写……)
格式:静态html格式更受搜索引擎的喜欢
伪静态:将动态网址伪装成静态网址

页面的动静态怎么区分:
动态:jsp,asp,php,.net等动态语言开发的页面
静态:由html语言开发

URL:
动态:包含? 加&符号标识符
静态:不包含? 加?标识符

网址与权重
首页:https://www.360docs.net/doc/8e1761394.html,
栏目页:https://www.360docs.net/doc/8e1761394.html, 二级域名-适合大型网站
https://www.360docs.net/doc/8e1761394.html, 三级域名
https://www.360docs.net/doc/8e1761394.html,/news/ 目录式-适合中小型网站
https://www.360docs.net/doc/8e1761394.html,.news/guonei/ 子目录
内容页:https://www.360docs.net/doc/8e1761394.html,/news/12.html 静态页面
301:规范URL,利于权重的传递
设置方法:空间控制面板-301设置
404:提高用户体验,提高搜索引擎的友好度
设置方法:建立一个404页面,放到根目录
控制面板-404设置
不要让404页面自动跳转到首页

================================================================

URL优化方案:
公司简介
https://www.360docs.net/doc/8e1761394.html,/jj.asp
建议改为
https://www.360docs.net/doc/8e1761394.html,/jianjie/
原因不利于搜索引擎抓取,jj.asp不是目录,权重低

================================================================


标签优化:



页面的标题,包含当前页面主要关键词,关键词数量(没有数量限制,最好控制数量在3-5个关键词,40个汉字之内利于搜索引擎抓取,分词符,减号,下划线,竖线)

自动刷新


(两个单词用逗号隔开)
Baiduspider 不写默认允许(不写或all)
noindex,nofollow
=none(空)
仅建立搜引,禁止储存快照






权重标签:突出关键词的权威和重要程度

一级标题,文章主标题,一个页面只出现一次


二级标题,导航(面包屑导航,次导航)


三级标题,相关新闻


关键词
强调关键词,同一个词第一次出现时使用
加粗关键词
关键词
关键词



图片优化标签:
1.图片注释说明:
关键词1
2.

图片大小优化:
(1)降低图片品质(降低品质-photosop-文件-另存为web和设备所有格式-jpg)
(2)裁切(切片-photosop-切片工具-文件-另存为web-类型html和图像)






更新内容:
质量:原创文章
提高网站收录比例,吸引蜘蛛程序,提高网站权重
劣势:效率低,影响收录和用户体验

原创文章思路:
1.确定主题(根据网站的内容,营销目标,用户需求)
2.拟定标题(根据用户需求找到合适的切入点,标题有吸引力,包含关键词)
3.列出大纲(行业发展,市场趋势,市场需求)
4.收集素材
5.撰写文章

关键词词系构建:
关键词拓展:
核心词(奥运会)-----二类词(人物,地点,事件,姚明)-----三类词(篮球)

关键词布局:
1.标题-核心词
2.每段第一句包含二类词
3.首尾段包含二类词
4.其他段落包含三类词

==============================================================

伪原创:假的原创文章(给搜索引擎认为是一篇原创文章)
优势:效率高,更新数量多,提高收录,增加用户体验

伪原创修改:
1.修改标题:同义词替换,数字替换,语序重排
2.修改内容:自创首尾段,扩充资料

翻译文章:其他语种




采集数据:
dede后台:采集-采集节点管理-增加新节点-普通文章
火车头:新建分组-新建任务

=================================================================

常见seo作弊手法:
1.关键词堆砌:在页面代码,如title,description,alt,注视等处重复书写关键字的行为
2.隐藏文字
3.隐藏链接
4.页面跳转
5.偷换页面
6.复制站点或内容
7.桥页
8.隐藏页面
9.垃圾链接

提高搜索引擎收录
1.网站提交
2.网站查询收录
3.交换或购买友情链接
4.去问答类平台回答问题
5.微博互动
6.论坛发帖
7.网摘站提交
8.原创投稿(软文)
























相关文档
最新文档