seo框架
seo流量=搜索量*收录量*点击*排名
1 收录量=页面数量*页面质量*抓取量
A(抓取量:外链批量内链批量sitemap 百度ping提交查收录工具百度url提交百度批量搜藏更新频率)
B(页面质量:打开速度页面大小原创度页面丰富化图文标签写法关键词布局常用标签布局密度)
C(页面数量:新增页面数tags聚合搜索聚合专题聚合列表页seo频道品牌页)
2 搜索量=行业搜索量*网站覆盖比例
A(取词方法:百度竞价后台关键词工具第三方百度竞价提词工具淘宝搜狗谷歌等关键词工具同行网站提词工具百度知道批量替换同义词别名词目标人群词分析收集)
3 点击(将对的人引导到对的着陆页面)
A(点击率提升:字数控制标题类:增加特殊字符[官,多图,低价,最新,打折] 增加时间概念[2015] 描述类:[修改贴近人心需求特殊字符同标题] 增加搜索引擎缩略图片做差异化)
4 排名=站内因素*站外因素*其他因素
A(站内因素:做整站收录比提升做整站相关性提升做更新频率调整做页面质量处理做丰富化处理三个标签写法密度位置布局常用标签布局alt宽高布局原创等页面重要性布局打开速度代码等简化内链定向锚文本布局长尾词记录单更新机制内容用户体验处理)
B(站外因素:平台选取外链发布增加频率商铺链接布局新闻源软文布局微博外链布局友情链接301网站博客外链书签外链导航外链买相关链接论坛外链文库外链问答外链百科贴吧外链视频平台SNS外链软文外链威客平台外链招聘平台外链b2bb2c 外链评价类外链论坛签名外链博客签名外链站长工具类外链
【筛选依据:锚文本>网址>文本流量>无流量相关>不相关高权重>低权重】)
C(其他因素:初始权重权威性3.0类推荐跳出率pv uv ip 用户隐性需求)
待拓展
搜索算法:
1 李彦宏超链接算法
2 HITS算法
3 TrustRank算法
4 Google PR算法
5 Hilltop算法
6 TF/IDF算法7百度分词算法
作弊算法:
1 隐藏文字
2 隐藏链接
3 垃圾链接
4 买卖链接5链接农场6 链接向坏邻居7 隐藏页面8 PR劫持9 桥页
10 跳转11 诱饵交换12 关键词堆积13 大规模站群14 利用高权重15 内容农场
搜索引擎原理
爬行抓取预处理排名
搜索引擎第一代文本分析第二代链接分析第三代用户为中心
抓取策略:宽度优先遍历策略非完全PR策略OCIP策略大站优先策略
网页更新策略:历史参考策略用户体验策略聚类抽样策略
暗网抓取
分布式爬虫策略:主从式分布爬虫对等式分布爬虫
索引:正向匹配逆向匹配单词文档矩阵倒排索引哈希加链表树形结构两遍文档遍历法排序法归并法
索引策略:完全重建策略再合并策略原地更新策略混合策略
查询处理:一次一文档一次一单词跳跃指针
多字段索引:多索引方式倒排列表方式扩展列表方式
短语查询:位置信息索引双词索引短语索引混合方法
分布式索引:按文档划分按单词划分
倒排列表压缩算法:一元编码与二进制编码Elias Gamma算法与Elias Delta算法
Golomb算法与Rice算法变长字节算法SimpleX系列算法PForDelta算法
静态索引裁剪:以单词为中心裁剪以文档为中心裁剪
检索与排序:布尔模型向量空间模型(文档表示相似性计算特征权重计算)
概率检索模型:二元独立模型BM25模型BM25F模型
语言模型方法
机器学习排序:单文档方法文档对方法文档列表方法
检索质量评价标准:
精确率与召回率P@10指标MAP指标
链接分析:
随机游走模型子集传播模型链接陷阱与远程跳转
HITS算法:Hub页面与Authority页面相互增强关系
SALSA算法智能游走模型偏置游走模型PHITS算法BFS算法
网页反作弊(内容作弊链接作弊页面隐藏作弊通用链接反作弊web2.0作弊专用链接反作弊识别内容作弊
反隐藏作弊)
用户搜索意图分类查询会话点击图查询图编辑距离噪声信道模型
网页去重:通用去重算法框架Shingling算法I-Match算法SimHash算法(文档指纹计算相似文档计算) SpotSig算法(特征抽取相似文档查找)
关键词
关键词工具导航型关键词交易型关键词信息型关键词
蜘蛛陷阱
Flash Session ID 各种跳转ifream框架动态URL javascript链接要求登录强制使用Cookies
禁止收录和url
robots nofollow canonical 静态化伪静态首选域301重定向404标签url规范化处理相对路径绝对路径xml网站地图html网站地图sitemap 404页面
权重分配
单入口多入口权重页栏目页面专题页面搜索页面品牌页面首页nofollow首页翻页过多处理面包屑链接处理noodp标签
页面标签
a标签TDK标签H1标签b,strong 斜体标签alt标签精简代码w3c认证更新机制
谷歌沙盒效应谷歌dannes丹斯谷歌炸弹
原创方法
翻译扫描书本加评价组合内容聚合页面(伪原创工具通过其他搜索引擎拿内容采集其他网站)
最新算法
百度绿萝算法1.0 百度绿萝算法2.0 谷歌熊猫算法谷歌企鹅算法百度冰桶算法
移动网站做法
url适配权重根据pc权重专业
seo工具
seo站长工具爱站工具xenu sitemapx 斗牛工具战神工具金花站长工具光年日志分析工具Alexa工具百度站长工具百度指数百度风云榜谷歌趋势谷歌百宝箱谷歌AD
微软广告工具谷歌快讯服务器头信息检测w3c验证雅虎外链查询工具外链概况工具关键词问答谷歌搜索解析seo for firefox seo工具条火狐浏览器search status插件
站长帮手SEOmoz工具Backlink Watch工具TouchGraph工具Quintura工具Google AD Planner Majestic SEO工具追词工具