MIP Cache规范介绍 MIP Cache规范是什么
使用方法
在开发页面时,无需对 MIP Cache 进行额外关注,只要保证MIP页面、图片等资源是允许MIP cache的UA(baidumip, baidumib)抓取即可。
在引用图片等静态资源时,无论是否支持https,直接引用本站服务器上的图片即可。
如使用:<mip-img src="http://filesimg.111cn.net/2016/12/16/20161216114316209.png">。
MIP-Cache 生效流程
在 MIP 页被爬虫抓取后,会自动对静态资源的进行缓存,并且替换页面中的静态资源引用地址为缓存地址。搜索结果页会优先跳转到MIP-Cache url,在MIP-Cache缓存到期时进行一次回源,访问原页面 URL 并重新缓存。
缓存后的页面都是https的,安全性更高。
了解MIP cache的url规则
url规则和下列情况有关:
内容类型:图片、MIP页面等,图片使用'/i',其他使用'/c'协议类型:使用TLS,https的增加'/s',http的不加
例如:
1、网页地址或css、js https资源:
originalUrl:https://www.mipengine.org/
cdnMipUrl:https://mipcache.bdstatic.com/c/s/www.mipengine.org
http资源:
originalUrl:http://m.example.com/
cdnMipUrl:https://mipcache.bdstatic.com/c/m.example.org
2、图片 https资源:
originalUrl:https://www.mipengine.org/static/img/banner_wise_3f04050.jpg
cdnMipUrl:https://mipcache.bdstatic.com/i/s/www.mipengine.org/static/img/banner_wise_3f04050.jpg
http资源:
originalUrl:http://www.sinaimg.cn/dy/slidenews/1_img/2016_25/2841_703424_763161.jpg
cdnMipUrl:https://mipcache.bdstatic.com/i/www.sinaimg.cn/dy/slidenews/1_img/2016_25/2841_703424_763161.jpg
页面编码要求
强制使用UTF-8编码
MIP Cache 更新机制
1、MIP Cache 常规更新机制
MIP Cache 常规更新机制也是页面最常规,最常用的更新机制。目前页面更新周期52分钟,当用户访问 MIP 页面时,如果页面缓存已经超时,MIP Cache 会将当前页面返回给用户;与此同时,异步的发起一个请求,去更新 MIP Cache 中存储的页面。这样,后续访问这个页面的用户将会看到更新后的页面。目前,线上页面更新的平均时间(可以理解为有点击的间隔时间)为1天左右。目前抓取限制比较多的站点,更新的时效性无法保证,也请相关站长保证自己网站,服务的稳定性。
2、MIP Cache 快速更新机制
考虑到一些特殊情况,需要尽快更新 MIP Cache 中的页面。比如线上 BUG 紧急修复、发现网页有黄反等需要紧急更新或者删除的内容时,MIP Cache 也开放了单独的清理接口,阅读MIP-cache清理了解更多信息。生效时间大概5min。
3、MIP Cache 页面删除
如果有一些废弃页面需要删除:
- 站长首先删除本站原页面
- 调用 MIP Cache 快速更新机制删除 Cache
- 删除后,请给 MIP Cache 非200(404或者其他)状态码,防止cache中缓存错误页。
添加预取标签
待扩展
<linkhref="***"rel="dns-prefetch">
MIP校验规则是什么,MIP页面会有严格的规范校验,不允许存在任何校验不通过的问题存在,下面小编将为大家详细介绍MIP校验规则。本文档意在帮助开发者找到校验的内容和规则,快速定位校验不通过的原因。
MIP HTML 标签和属性错误
1. 缺少强制性标签
提示 |
MANDATORY_TAG_MISSING |
---|---|
错误说明 | "The mandatory tag '%1' is missing or incorrect." |
错误说明 | 强制性标签'xxx'缺失或错误 |
修复方法 | 添加(或者更正)强制性html标签 |
在MIP HTML中,强制性标签包括:
说明 |
备注 |
---|---|
<!doctype html> | 大小写均可 |
<html mip> | 强制小写 |
<head> | 强制小写 |
<meta charset="utf-8"> | utf-8不区分大小写,无单引号或者双引号限制 |
<meta name="viewport" content="width=device-width,initial-scale=1"> | 强制小写,无单引号或者双引号限制 |
< link rel="stylesheet" type="text/css" href="https://mipcache.bdstatic.com/static/v1/mip.css" > | 强制小写,无单引号或者双引号限制,v1.1.1会根据版本不同而不同 |
<script src="https://mipcache.bdstatic.com/static/v1/mip.js" ></script > | 强制小写,无单引号或者双引号限制,v1.1.2会根据版本不同而不同 |
<body> | 强制小写 |
<link rel="canonical" href="http(s)://xxx"> | 强制小写 |
PS:meta 标签 name="viewport" 时, content的值必须且最少含有 width=device-width, minimum-scale=1 以及 initial-scale=1这3个属性且顺序不固定。
2. 禁用标签
提示 |
DISALLOWED_TAG |
---|---|
错误说明 | "The tag '%1' is disallowed." |
错误说明 | 禁止使用'xx'标签 |
修复方法 | 删除禁用标签 |
大部分 HTML 标签都是允许使用的,禁用或者需要替换的标签使用请参考:MIP HTML规范
3. 无效属性值
提示 |
INVALID_ATTR_VALUE |
---|---|
错误说明 | "The attribute '%1' in tag '%2' is set to the invalid value '%3'." |
错误说明 | 标签'xx'中的属性'xx'的属性值'xx'无效 |
修复方法 | 修改为有效属性值 |
当html标签有属性值不正确的时候,会报这个错误。mip中需要注意的有:
a:href属性不允许使用javascript:协议,
a:target属性需要设置为_blank
mip-img
src:必须是一个url
mip-pix
src:必须是一个支持https的地址url,
如果选用百度云提供的https代理,url中带"t={TIME}&title={TITLE}&host={HOST}&from=baidu"
其他html基本页面属性规范不变
注意:
1. MIP HTML中的url强制是https的
2. <a>标签:
<a href="javascript:xxx()"></a> 错
- <a href="xxx" target="_blank"></a> 对
4. 属性值的无效值
提示 |
INVALID_PROPERTY_VALUE_IN_ATTR_VALUE |
---|---|
错误说明 | "The property '%1' in attribute '%2' in tag '%3' is set to '%4', which is invalid." |
错误说明 | 标签'xx'中存在属性'yy','yy'中存在属性'zz',属性'zz'的属性值'aa'无效 |
修复方法 | 更正无效属性值 |
可能出现属性值的无效值的情况:
<meta name="viewport" content="width=device-width,minimum-scale=1,initial-scale=1">
width的属性值device-width
initial-scale的属性值1
<script type="application/ld+json"></script>
<script type="application/json"></script>
除了外链 MIP 所需 js,script标签的type的属性值应该为application/ld+json 或 application/json
注意:除上述给出的值外均为无效值
5. 缺少强制性属性
提示 |
MANDATORY_ONEOF_ATTR_MISSING |
---|---|
错误说明 | "The tag '%1' is missing a mandatory attribute - pick one of %2." |
错误说明 | 标签'xx'的强制性属性'xx'缺失 |
修复方法 | 添加正确是属性 |
例如 mip html中 mip-img 和 mip-pix具有强制性属性的src:
mip-img
src
mip-pix
src
6. 直接父标签错误
提示 |
WRONG_PARENT_TAG |
---|---|
错误说明 | "The parent tag of tag '%1' is '%2', but it can only be '%3'." |
错误说明 | 标签'a'的直接父标签应该是'b',而不是'c' |
修复方法 | 添加所需的父标签 |
有一些标签有制定的直接父标签,如下示例给出了每个标签必须的直接父标签:
!doctype 的直接父标签是 root
head 的直接父标签是 html
body 的直接父标签是 html
link 的直接父标签是 head
meta 的直接父标签是 head
style mip-custom 的直接父标签是 head
style 的直接父标签是 boilerplate
7. 非法父级标签
提示 |
DISALLOWED_TAG_ANCESTOR |
---|---|
错误说明 | "The tag '%1' may not appear as a descendant of tag '%2'." |
错误说明 | 标签'a'不应该是标签'b'的子标签 |
修复方法 | 删除非法嵌套标签 |
如:
<body>的子标签写在了<head>中
8. 强制父级标签
提示 |
MANDATORY_TAG_ANCESTOR |
---|---|
错误说明 | "The tag '%1' may only appear as a descendant of tag '%2'." |
错误说明 | 标签'a'只能是标签'b'的子级标签 |
修复方法 | 删除标签或者给标签添加正确的父级标签 |
img 必须是noscript的子级标签
video 必须是noscript的子级标签
audio 必须是noscript的子级标签
head 中使用 noscript 时必须作为head的最后一个子节点, body中的noscript没有限制
9. 唯一标签重复
提示 |
DUPLICATE_UNIQUE_TAG |
---|---|
错误说明 | "The tag '%1' appears more than once in the document." |
错误说明 | 标签'xx'只能出现一次 |
修复方法 | 删除多余的标签 |
一份html中,有的标签具有唯一性,也就是说只能出现一次,当html中有重复的唯一标签的时候,应该报错。
以下是唯一标签列表:
<doctype html>
<html mip>
<head>
<link rel="canonical" href=...>
<meta charset="utf-8">
<meta viewport>
<style mip-custom>
<body>
MIP校验工具地址:https://www.mipengine.org/validator/validate
本节的主要内容为MIP HTML规范说明,这是了解MIP的第一步,下面小编将为大家带来MIP HTML规范的详细说明介绍。头部使用规范
-
起始标签使用 <!doctype html>
-
html标签必须加上mip标记,即: <html mip>
-
必须包含 <head>和 <body>标签
-
必须在head标签中包含字符集声明: <meta charset="utf-8">,字符集统一为utf-8
-
必须在head标签中包含viewport设置标签: <meta name="viewport" content="width=device-width,initial-scale=1">,推荐包含minimum-scale=1
-
必须在head标签中包含 < link rel="stylesheet" type="text/css" href="https://mipcache.bdstatic.com/static/v1/mip.css" >
-
必须在body标签中包含 <script src="https://mipcache.bdstatic.com/static/v1/mip.js" ></script >
-
必须在head标签中包含 <link rel="canonical" href="http(s)://xxx" >
页面元素使用规范
MIP HTML 禁止使用对页面性能以及安全有较大影响的标签,请将其替换为MIP的特有标签(例如:将img标签替换为mip-img):
标签 | 使用范围 | 备注 |
img | 替换为mip-img | |
video | 替换为mip-video | |
audio | 替换为mip-audio | |
iframe | 替换为mip-iframe | |
style | 替换为<style mip-custom> | 只能在head标签中使用一次 |
script | 禁止使用 | 禁止使用script标签, 以下两种情况除外:1)外链mip组件所需js,2)type为 "application/ld+json" 或 "application/json" |
svg | 允许使用 | |
button | 允许使用 | |
link | 允许使用 | |
a | 允许使用,建议使用mip-link组件代替 | 不可以href="javascript:",target必须设置为_blank |
frame | 禁止使用 | |
frameset | 禁止使用 | |
object | 禁止使用 | |
param | 禁止使用 | |
applet | 禁止使用 | |
embed | 禁止使用 | |
form | 替换为mip-form | 内部允许使用input、textarea标签 |
input elements | 禁止使用 | 包括: select, option |
HTML 属性
- MIP HTML 中所有on开头的属性都不允许使用,如:onclick,onmouseover。
- MIP HTML 中允许使用on属性。
- MIP HTML 中不允许使用style属性。
自定义样式使用规范
出于性能考虑,html 中不允许使用内联style,所有样式只能放到head 的 style 标签里。
正确:
<head>
<stylemip-custom>
p{color:#00f;}
</style>
</head>
<body>
<p>Hello World!</p>
</body>
错误:
<pstyle="color:#00f;">Hello World!</p>验证规范
MIP校验工具地址:https://www.mipengine.org/validator/validate
本次一聚教程网为大家带来的是mip完整dome,让大家初步的了解mip加速是怎么实现的,下面请看详细的介绍。完整DOME如下:
为防止js自动生成,所以使用了截图的形式。
相关文章
PHP分布式框架如何使用Memcache同步SESSION教程
本教程主要讲解PHP项目如何用实现memcache分布式,配置使用memcache存储session数据,以及memcache的SESSION数据如何同步。 至于Memcache的安装配置,我们就不讲了,以前...2016-11-25- Promise是异步编程的一种解决方案,在ES6中Promise被列为了正式规范,统一了用法,原生提供了Promise对象。接下来通过本文给大家介绍Promise的介绍及基本用法,感兴趣的朋友一起看看吧...2021-10-21
- 下面小编就为大家带来一篇老生常谈javascript变量的命名规范和注释。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧...2016-10-02
- memche消息队列的原理就是在key上做文章,用以做一个连续的数字加上前缀记录序列化以后消息或者日志。然后通过定时程序将内容落地到文件或者数据库。php实现消息队列的用处比如在做发送邮件时发送大量邮件很费时间的问...2014-05-31
- 本章节讨论使用ES6编码风格到代码中需要注意的点。通过记住这些关键点,可以让我们写出更优美的、可读性更强的JavaScript ES6风格的代码。...2021-05-08
PHP中print_r、var_export、var_dump用法介绍
文章详细的介绍了关于PHP中print_r、var_export、var_dump区别比较以及这几个在php不同的应用中的用法,有需要的朋友可以参考一下 可以看出print_r跟var_export都...2016-11-25Framewrok7 视图介绍(views、view)使用介绍
下面我们来看一篇关于Framewrok7 视图介绍(views、view)使用介绍吧,希望这篇文章能够帮助到各位朋友。 一、Views 与View的介绍 1,Views (<div class="views">) (1)Vi...2016-10-02- 这篇文章主要介绍了C#编程的通用结构和程序书写格式规范,这里我们根据C#语言的开发方微软给出的约定来作为编写样式参照,需要的朋友可以参考下...2020-06-25
SpringCache 分布式缓存的实现方法(规避redis解锁的问题)
这篇文章主要介绍了SpringCache 分布式缓存的实现方法(规避redis解锁的问题),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2020-11-20- PHP日志类库在低版本中我们都没有看到了但在高版本的php中就有了,下面我们来看一篇关于PHP日志类库使用详解介绍吧. Monolog遵循PSR3的接口规范,可以很轻易的替换...2016-11-25
- 本文给大家总结了js编码规范知识,非常实用,在日常程序开发中经常可以用到,大家务必掌握...2016-06-24
- 本文着重介绍如何在XCODE中,通过C++开发在IOS环境下运行的缓存功能。算法基于LRU,最近最少使用,需要的朋友可以参考下...2020-04-25
- 这篇文章介绍了php获取当前url地址的方法小结,有兴趣的同学可以参考一下 本文实例讲述了php获取当前url地址的方法。分享给大家供大家参考,具体如下: js 获取: ...2017-01-22
- 介绍性指南 mod_perl 是个庞大而复杂的工具,它内建了许多模块帮助你方便地构建动态网站。这篇指南的目的是帮助你构建一个良好的 mod_perl 模块,并从中理解 mod_perl 的实现...2020-06-29
- 1. PHP-GTK介绍 1.1 PHP-GTK PHP-GTK是PHP的延伸模组,它可以让程式设计师写出在客户端执行的、且独立的GUI的程式。这个模组不允许在浏览器上显视GTK+的程式,它一开始就...2016-11-25
SpringBoot2 整合Ehcache组件,轻量级缓存管理的原理解析
这篇文章主要介绍了SpringBoot2 整合Ehcache组件,轻量级缓存管理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2020-08-10- 在php中要获取或目录权限我们可使用fileperms函数来获取,fileperms() 函数返回文件或目录的权限,。若成功,则返回文件的访问权限。若失败,则返回 false。 例子 1 ...2016-11-25
- php默认时区是欧美国家的所以与我们中国时区相差了整整8小时哦,下面我来给各位介绍php设置时区方法,有需要了解的朋友可进入参考。 在 php.ini 中,默认是 date.timez...2016-11-25
- 很多phper不知道如何在Windows下搭建Memcache的开发调试环境,最近个人也在研究Memcache,记录下自己安装搭建的过程。 ...2016-01-27
- OpenCart是国外著名的开源电子商务系统,由英国人Daniel一人独立开发,其社区非常活跃,由各国网友翻译出来的语言包已经达到18种,其中包括中文,俄文,法文,西班牙文,德文等等,下面...2016-10-10