SEO笔记
SEM=搜索引擎营销
PPC/CPC=关键词广告
PPC=pay per click
CPC=cost per click
SEO=搜索引擎优化
主流搜索引擎:
百度 https://www.360docs.net/doc/8e1761394.html,
搜狗 www.cogou
搜搜 https://www.360docs.net/doc/8e1761394.html,
有道 https://www.360docs.net/doc/8e1761394.html,
Google https://www.360docs.net/doc/8e1761394.html,
yahoo https://www.360docs.net/doc/8e1761394.html,
Bing https://www.360docs.net/doc/8e1761394.html,
360 https://www.360docs.net/doc/8e1761394.html,
中国信息网 https://www.360docs.net/doc/8e1761394.html,/
电子商务:广义:网络,手机,电视,广告,传真,物流,仓储,
狭义:网络上买卖商品
模式:
企业对企业:B2B=business to business 阿里巴巴,慧聪网,
企业对个人:B2C=business to customer 京东,B2B2C=天猫,凡客,1号店,当当,亚马逊
个人对个人:C2C=customer to customer 淘宝,ebay
电子政务:
G2G=政府对政府
G2B=政府对企业
G2C=政府对个人
O2O=online to offline 团购
offline to online
一 爬行和抓取:
吸引蜘蛛:权重高,更新快/多,导入链接,首页距离近
地址库:避免重复,而建地址库,记录被发现还没被发现的,和以被抓取
文件存储:蜘蛛抓取数据存入原始页面数据库
爬行时的重复内容检测:抓取中也进行,一定内容检测,权重低的站如果大量转载或抄袭,可能不在继续爬行
优化:发布外链,搜索引擎后台提交
二 预处理(索引)
目的:分析抓取来的页面中的信息
过程:
1 提取文字--提取出用于排名的内容文字:
2 中文分词--基于字典匹配,另一个是基于统计:
3 去停止词--中文的,地,得,英文a the等:
4 消除噪声--版权声明,导航条,广告,文章分类等
5 去除重复--相同内容在不同网站和同站不同网址上:
6 正向索引--按照页面内容分词并建立索引文件:
7 倒排索引--一关键词为索引建立索引文件:
8 链接关系计算--页面导入和导出链接数量:
9 特殊文字处理--可处理pdf,word,wps,不能处理图片,视频,flash,脚本程序。
优化:页面包含用户搜索词
三 排名:
目的:将相关结果显示给用户
过程:搜索词处理 分词 去停止词 匹配倒排索引 初始子集 相关性计算 排名过滤 显示 缓存预处理 记录用户行为
优化:提高相关性,提高用户体验
1 搜索词处理 故宫的正门是那个门
2 文件匹配 关键词匹配倒排索引文件
3 初始子集的选择 百度76*10 google100*10,页面权重为主要依据
4 相关性计算 关键词密度2%-8%,位置,链接,权重
5 排名过滤及调整 过滤作弊信息,调整排名
6 排名显示 调用原始页面的标题标签,说明标签,快照日期等数据
7 搜索缓存 常见的搜索词存入缓存,直接调用
8 查询及点击日志 记录用户搜索信息
关键词布局顺序:
从左到右
从上到下
A-->B<--C
四 搜索结果显示方式
1 缩进列表
2 全站链接
3 0ne-box
4 富摘要
5 面包屑导航
6 预览
7 品牌
8 百度应用
搜索引擎的分类
全文索引 google,百度
目录索引 yahoo,sina的分类目录,
元搜索引擎
集合石搜索引擎
门户搜索引擎
免费链接列表
高级搜索指令:
查询网站收录量:site:https://www.360docs.net/doc/8e1761394.html, 不加www
查询网站外链数量:domain:https://www.360docs.net/doc/8e1761394.html, 百度
link:https://www.360docs.net/doc/8e1761394.html, 谷歌
百度站长工具:https://www.360docs.net/doc/8e1761394.html, 查询较准确
查询特定格式文件:filetype:doc 建站方案
查询竞争对手网站:related:https://www.360docs.net/doc/8e1761394.html,
"关键词"完全匹配
* 通配符 查新长尾词
inurl:关键词
inrtitle:关键词
PR值:佩琪等级 page rank
0-10级,级别越高表示网站权重越高
网站首页PR代表 整站的PR
A-->B-->C-->D
5 6 3
PRd=(PRa/Ca+PRb/Cb+……+PRn)*d+(1-d)
d=0.85
网站A PR=8 导出12 8/13*0.85+0.15
提高PR值:
自己网站外链导入越多越好
自己网站导出越少越好
对方网站PR越高越好
对方网站导出越少越好
相关的网站做链接
衡量网站的相关数据:
1.百度权重:关键词指数,百度里面的排名,能够预计带来的流量来计算百度权
查询:https://www.360docs.net/doc/8e1761394.html, 站长
2.alexa排名:根据网站流量排名
查询:https://www.360docs.net/doc/8e1761394.html,
3.网站收录:反映:搜索引擎是否喜欢网站内容(收录总量,速度,比例,稳定性)
查询:site:https://www.360docs.net/doc/8e1761394.html,
https://www.360docs.net/doc/8e1761394.html,
提高:更新内容
4.百度快照:蜘蛛抓取时间
反映:蜘蛛的抓取频率
查询:site:https://www.360docs.net/doc/8e1761394.html,点击百度快照
提高:链接,规律更新
5.外链:反映:网站的权重
查询:link和domain或https://www.360docs.net/doc/8e1761394.html,
提高:发布高质量外链
6.死链:无法找到资源文件,蜘蛛陷阱,用户体验差
检测:XENU
处理:去掉死链接
做404页面
提交死链
7.PR值:反映网站权重
衡量依据:网站的外链数量和质量
查询:站长工具
提高:
8.关键词排名:
用户规模:百度指数网址:https://www.360docs.net/doc/8e1761394.html,
百度推广网址:https://www.360docs.net/doc/8e1761394.html,
爱站网网址:https://www.360docs.net/doc/8e1761394.html,
排名榜网址:https://www.360docs.net/doc/8e1761394.html,
潜在流量:百度推广关键词规划师,金花
竞争度分析:百度指数,"",inurl,intitle,搜索结果URL
百度指数:用户规模
竞争度
广告投放时段作为参考
和网站流量对比,排查问题
域名分析:
类型:由后缀
org,gov,edu,com
长度:越短权重比较高
时间:注册:注册时间越久信任度越高
老域名积累了权重,有一些外链,查询-万网新网等代理商
到期:到期时间久信任度较高
指向:不要频繁解析到不同的空间
含义:体现网站的内容
产品,业务,服务,品牌
(拼音,单词,缩写,混写,谐音,数字)
链接:内链:内部连接,同一域名下的不同页面间链接
外链:不同域名间的网页链接
导入/反向:别人给我做链接 A-->B (B获得导入链接)
导出: (A导出链接)
收录总量:被搜索引擎收录的页面总量
反映搜索引擎是否喜欢网站
查询:site:https://www.360docs.net/doc/8e1761394.html,
提高:更新数量,质量
收录速度:反映蜘蛛访问频率
查询-site:https://www.360docs.net/doc/8e1761394.html, 百度快照
提高:更新频率,质量
收录比例:收录量/网站页面总量
查询:site命令/XENU总量
提高:更新质量,频率
收录稳定:长期跟踪记录收录总量
浮动过大说明搜索引擎信任度低
======================================================================
关键词选取策略:
词频:出现次数
密度:关键词次数/页面总词量 (2%-8%)
布局:title,description,body (从上到下,从左到右),keywords
权重标签:
一级标题,文字主标题,文章页
级别最高二级标题,导航(次导航,面包屑导航),内容页/栏目页
三级标题,相关新闻,文章页,
关键词
关键词
关键词
关键词
关键词
关键词
连接权重
用户行为
_________________________________________________________________
_________________________________________________________________
关键词选取原则:
1.相关性强:关键词与网站内容相关
从网站内容出发选择关键词
产品,业务,服务,品牌
2.搜索量大的词:用户规模大,带来流量比较多
百度指数
3.竞争度小:容易优化
百度指数,intitle,inurl, 搜索结果URL
4.转化率高:用户搜索意图判断
===================================================================
3
花店
名称:花无缺花店
产品:各种鲜花
1.确定产品:鲜花,花篮
业务:婚庆鲜花,店里鲜花,开业鲜花,庆典
服务:配送,预定
品牌:花无缺
2.客户:年龄:25-45
地域:附近3公里
性别:不限
职业:老板 ,职业
行业:婚庆,演绎,餐饮,服饰
活跃时间:上班时间
3.发掘关键词:
产品词
:玫瑰,百合,康乃馨……
业务词:婚庆鲜花,店里鲜花,开业鲜花,庆典,花篮
服务词:鲜花配送,鲜花预定,网上订花……
开业花篮,生日鲜花,北京鲜花批发,北京鲜画速递
对手
百度长尾词:
1.搜索下拉框
2.搜索结果下面底部相关搜索
3.百度指数里面的,需求图谱,相关词分类
4.百度推广关键词规划师
核心:主推词
为网站带来80%流量
从网站内容出发+用户搜索量
长尾词:次要的词
词量多,竞争度低,为网站带来的流量多少
从用户搜索习惯发掘
关键词布局:
核心词-首页(title,description,keywords,body)
长尾词-栏目/内容页(title,description,keywords,body)
==========================================================
步骤:
了解企业/网站的内容
分析用户的需求,搜索习惯
分析数据(搜索量,竞争度)
确认核心关键词
部署到网站各个页面
===========================================================
robots.txt(蜘蛛协议)
协议文件:提示蜘蛛抓取的内容
放置位置:更目录
区分大小写
https://www.360docs.net/doc/8e1761394.html,er-agent:Baiduspider(spider 蜘蛛程序)
Allow:/a/
Allow(允许):/about/(目录要分开写,不能写在一起)
Disallow(禁止抓取网站任何内容):/
Disallow:/templets/
Disallow:/plus/
https://www.360docs.net/doc/8e1761394.html,er-agent:Baiduspider
Allow:/ (允许所有内容)
Disallow:/ (/禁止所有内容,不加/允许所有内容)
https://www.360docs.net/doc/8e1761394.html,er-agent:Goolebot
Disallow:/
https://www.360docs.net/doc/8e1761394.html,er-agent:* (针对所有蜘蛛程序)
Disallow:/
Disallow:*.jpg$ (针对文件要用$结尾)
https://www.360docs.net/doc/8e1761394.html,er-agent:* (针对所有蜘蛛程序)
Disallow:/
Sitemap:https://www.360docs.net/doc/8e1761394.html,/sitemap.xml
Sitemap文件:网站地图(网站页面地址)
作用:罗列出网址地址,让蜘蛛抓取更快速,方便
如何建立:使用sitemapbuilder
放置位置:根目录
名称:sitemap.xml
提交sitemap:
1.在robots.txt声明(比较被动,蜘蛛不来抓取的话,无法访问sitemap)
2.在百度站长后台提交(主动提交)
主动推送:将网站内容实时推送给百度,收录效率更高
方法:在百度站长后台-链接提交-自动提交-主动推送
将php代码放到,文件存为tuisong.php,上传到更目录(推送网站不要重复提交,否则会降低推送的网址数量)
=============================================================
蜘蛛陷阱:
flash,各种跳转(有欺骗行为),sessionID,要求登录,强制使用cookie,框架结构
==============================================================
http状态码
1** 请求发送当中
2** 成功访问
3** 跳转/定向 301-永久跳转
302-临时跳转
4** 用户端错误 404-无法找到对应的资源文件
5** 服务器端错误
空间域名优化:
构成:http:https://www.360docs.net/doc/8e1761394.html,
协议 二级域名 主域名 后缀
合法字符:数字,英文,-
长度:1-63(越短越好,不建议超过11个)
类型:由后缀决定
.com营利性组织 .net互联网组织 .org非盈利组织 .gov政府组织 .edu教育组织
地域划分 国家级域名 .cn .tw .hk .jp
含义:体现出网站的内容
产品,服务,业务,品牌
(拼音,单词,缩写,混写,谐音,数字)
时间:注册时间:注册时间越久,搜索引擎的信任度越高
老域名(积累了一定的权重,有外链)
查询:https://www.360docs.net/doc/8e1761394.html,
到期时间:到期时间越久搜索引擎信任度越高
指向:不要频繁解析到不同空间和网站上
==================================================================================
空间:存放网站数据的服务器
类型:独立主机-一台独立的服务器-安全,权限较高
费用高,技术要求高
虚拟主机-一台服务器划分出多个空间-价格低
技术要求低,安全性差,多个公用同一IP
VPS-虚拟独立知己-独享IP,数据库,宽带
(各网站间无关联)
云主机-价格适中,存储量大,处理速度快
=======================================================================
配置:操作系统-Windows,Linux
web服务器-IIS,Apache
数据库-SqIServerMySQL
语言-jsp,asp,PHP
容量-空间大小;流量;带宽(共享,独享);IP(共享,独享);接入方式(单线,双线,多线);并发数(同时处理请求的数量);稳定性,良好的共处环境;
-------------------------------------------------------------------------
网站内链优化:根据主域名判断
内链:网站内部链接;同一域名下的不同页面间的链接
网站导航:主导航,次导航,面包屑导航,网站地图
1.主导航-网站内容大的分类
所有页面顶部
可以识别的锚文本链接
使用关键词作为栏目名称(关键词布局)
-----------------------------------------------------
2.次导航-网站内容细致分类
出现在页面顶部,左侧,底部,下拉列表
使用可识别的锚文本
关键词作为次导航栏目名称
-----------------------------------------------------
3.面包屑导航-内容页/栏目页上方
提示用户目前所处的位置
使用关键词锚文本链接
层级3层之内
------------------------------------------------------
4.网站地图-引导用户和蜘蛛抓取的一个html页面
放在根目录,在首页头部做链接
------------------------------------------------------
排行榜-打破现有网站栏目和内容分类,将不同类别的内容划分到一起
排序规则-最新新闻,热门新闻(点击量,回复量)
位置-首页,栏目,内容页侧边
=============================================================
网站结构
1.逻辑结构:网站页面间的链接关系--内链
扁平结构-所有页面在首页做链接
好处-1.层级浅用户点击方便
2.利于蜘蛛抓取
3.首页权重直接传递到页面
适合小型企业网站
坏处:
树形结构-分类链接,首页-栏目-子栏目-内容页
好处-1.内容分类利益用户的访问
2.内容较多利于后期的维护管理
3.利于权重传递到主栏目
适合中大型网站
坏处:
2.物理结构:网站文件实际存放的位置
扁平结构:所有文件直接放到根目录
适合小型网站
好处-1.文件层级浅,提高网页的权重
2.
坏处-
树形结构:网站的文件分类放到不同的文件夹中(层级不要超过三级)
适合大中型网站
好处-利于管理和优化
===================================================================
网站页面间的链接关系
首页:栏目,重要内容
栏目页:首页,其他栏目,该栏目下的内容
内容页:相关新闻,其他栏目,首页
====================================================================
内链对网站权重的影响
首页权重7
栏目页权重6
子栏目权重5
内容页权重4
网站多入口,利于网站收入
相关产品链接:根据关键词判断相关性
锚文字分布及变化:超链接,关键词分布变化
nofollow 屏蔽权重:
联系我们
深层链接:重新抓取链接
=====================================================================
URL优化:
URL:统一资源定位器/网址
https://www.360docs.net/doc/8e1761394.html,/2016/08/02/ARTIcRXYSj8vQdtjVkTXG5Ue160802.shtml
构成:资源类型+空间地址+端口+路径+文件名.格式
长度:所有字符总和,不超过80个字符
层级:放的物理结构层级,路径不超过3级
含义:域名+路
径+文件名(包含关键词拼音,单词,缩写……)
格式:静态html格式更受搜索引擎的喜欢
伪静态:将动态网址伪装成静态网址
页面的动静态怎么区分:
动态:jsp,asp,php,.net等动态语言开发的页面
静态:由html语言开发
URL:
动态:包含? 加&符号标识符
静态:不包含? 加?标识符
网址与权重
首页:https://www.360docs.net/doc/8e1761394.html,
栏目页:https://www.360docs.net/doc/8e1761394.html, 二级域名-适合大型网站
https://www.360docs.net/doc/8e1761394.html, 三级域名
https://www.360docs.net/doc/8e1761394.html,/news/ 目录式-适合中小型网站
https://www.360docs.net/doc/8e1761394.html,.news/guonei/ 子目录
内容页:https://www.360docs.net/doc/8e1761394.html,/news/12.html 静态页面
301:规范URL,利于权重的传递
设置方法:空间控制面板-301设置
404:提高用户体验,提高搜索引擎的友好度
设置方法:建立一个404页面,放到根目录
控制面板-404设置
不要让404页面自动跳转到首页
================================================================
URL优化方案:
公司简介
https://www.360docs.net/doc/8e1761394.html,/jj.asp
建议改为
https://www.360docs.net/doc/8e1761394.html,/jianjie/
原因不利于搜索引擎抓取,jj.asp不是目录,权重低
================================================================
标签优化:
自动刷新
(两个单词用逗号隔开)
Baiduspider 不写默认允许(不写或all)
noindex,nofollow
=none(空)
仅建立搜引,禁止储存快照
权重标签:突出关键词的权威和重要程度
一级标题,文章主标题,一个页面只出现一次
二级标题,导航(面包屑导航,次导航)
三级标题,相关新闻
关键词
强调关键词,同一个词第一次出现时使用
加粗关键词
关键词
关键词
图片优化标签:
1.图片注释说明:
2.
图片大小优化:
(1)降低图片品质(降低品质-photosop-文件-另存为web和设备所有格式-jpg)
(2)裁切(切片-photosop-切片工具-文件-另存为web-类型html和图像)
更新内容:
质量:原创文章
提高网站收录比例,吸引蜘蛛程序,提高网站权重
劣势:效率低,影响收录和用户体验
原创文章思路:
1.确定主题(根据网站的内容,营销目标,用户需求)
2.拟定标题(根据用户需求找到合适的切入点,标题有吸引力,包含关键词)
3.列出大纲(行业发展,市场趋势,市场需求)
4.收集素材
5.撰写文章
关键词词系构建:
关键词拓展:
核心词(奥运会)-----二类词(人物,地点,事件,姚明)-----三类词(篮球)
关键词布局:
1.标题-核心词
2.每段第一句包含二类词
3.首尾段包含二类词
4.其他段落包含三类词
==============================================================
伪原创:假的原创文章(给搜索引擎认为是一篇原创文章)
优势:效率高,更新数量多,提高收录,增加用户体验
伪原创修改:
1.修改标题:同义词替换,数字替换,语序重排
2.修改内容:自创首尾段,扩充资料
翻译文章:其他语种
采集数据:
dede后台:采集-采集节点管理-增加新节点-普通文章
火车头:新建分组-新建任务
=================================================================
常见seo作弊手法:
1.关键词堆砌:在页面代码,如title,description,alt,注视等处重复书写关键字的行为
2.隐藏文字
3.隐藏链接
4.页面跳转
5.偷换页面
6.复制站点或内容
7.桥页
8.隐藏页面
9.垃圾链接
提高搜索引擎收录
1.网站提交
2.网站查询收录
3.交换或购买友情链接
4.去问答类平台回答问题
5.微博互动
6.论坛发帖
7.网摘站提交
8.原创投稿(软文)