MinimalistYing.io

Cookie 和 WebStorage
2018-09-10
技术
浏览器

为什么需要客户端存储

  • 记录用户登录状态,当用户下次访问时不必重新登录
  • 存储一些用户对应用的自定义偏好设置,例如主题色、表格每页默认显示条数等
  • 一些广告商需要通过客户端端存储的一些用户行为数据来做一些更个性化的推荐

恰当运用客户端存储可以很好的提升用户体验。

Cookie 其实就是网站存储在客户端的一些数据,这些数据会自动的被加到网站发起的每个 HTTP 请求的 Request Header 中,通常情况下服务端和客户端都可以对 Cookies 进行 CRUD 操作。

HTTP State Management Mechanism

// 最简单的设置方式 属性全部采用默认值
document.cookie = 'name=value'
// 自定义 Cookie 属性
document.cookie = 'test=111; max-age=3600; domain=xx.com; path=/;'

注意一次只能同时新增一个 Cookie。

// 修改 test 为 222
document.cookie = 'test=222; max-age=7200; domain=xx.com; path=/'
// 删除 test
document.cookie = 'test=; max-age=0; domain=xx.com; path=/'

这里要注意的是要确保 domain 以及 path 与待修改 Cookie 设置的一致,因为 Cookie 其实是在同一个域名和路径下唯一。

例如我们访问 www.a.com/test/xx.html,可以同时存在 test=1; domain=a.com; path=/test 以及 test=1; domain=a.com; path=/,这俩个 name 相同但是 path 不同的同名 Cookie。

所以只有 name domain path 这三个值都相同时才能确定一个 Cookie。

通过 document.cookie 获取到的是所有数据,类似 name1=value1; name2=value2 的字符串,要拿来使用的话还需通过一系列字符串操作将需要的值取出。

由于 Cookie 涉及到用户的隐私,用户可以手动禁止浏览器使用 Cookie,绝大多数浏览器都可以通过以下代码来判断用户是否禁用 Cookie。

navigator.cookieEnabled

Ps: 经本人测试 禁用 Cookie 后 Github 淘宝 等网站都无法正常访问,感觉现在大多数用户都不会去禁用 Cookie,不然会有一堆网站访问不了。

Ps: 虽然大多数人不会完全禁用 Cookie,但是估计有少数注重隐私的人会禁用第三方 Cookie 。最近碰到个问题是由于一个同学在 Chrome 里禁用了第三方 Cookie 导致的,这种情况 navigator.cookieEnabled 是检测不了的。禁用第三方 Cookie 会影响一些跨站的请求。

  • Domain
    指定 Cookie 存储在哪个域名下,默认为当前服务器的域名。
    当然也遵循同源策略事实上 Cookie 和浏览器的 Same-Origin Policy 没什么关系,实际上意味着的是第一方 Cookie 或者第三方 Cookie。
    例如存放在 .a.com 下的 Cookie,在 www.one.a.com 以及 www.two.a.com 页面上携带都属于第一方 Cookie。 这里需要特别注意 Cookie 不能跨域,例如在 www.son.a.com 页面下,我们可以设置 Cookie 的 domain 为 a.com
    这样在 www.another.a.com 页面也可以获取到该 Cookie,但是不能在该页面试图去操作 domain 为 b.com 的 Cookie。

  • Path
    指定 Cookie 存储在哪个路径下,默认为当前 URI 中的路径。
    例如在 www.a.com/page/one.html 我们按默认属性设置了一个 Cookie,那么在 www.a.com/page/two.html www.a.com/page/son/three.html 这些页面下都可以获取这个 Cookie,但是在 www.a.com/another/four.html 页面上便无法获取这个 Cookie。
    可以将 path 设为 / 使得访问当前域名下所有路径的网页都能拿到设置的 Cookie。

  • Max-Age 最大存储时间,以秒为单位,为 0 时立即删除当前 Cookie,默认(或者为负数)当浏览器 Session 结束时清除。当同时设置了 Max-Age 以及 Expires 时,前者优先级更高。

  • Expires 存储失效的 GMT 时间,这个日期只与客户端有关,默认当浏览器 Session 结束时清除。

  • Secure 包含该属性的 Cookie 只能通过 HTTPS 传输。

  • HTTPOnly 只能在服务端进行设置,包含该属性的 Cookie 只会在 Request Headers 中出现,前端无法通过 document.cookie 查看或修改。

  • SameSite 这个属性是 Chrome 在后来的版本中为了防止 CSRF 新增的,所以在协议中还看不到相关的字段。一共有三个可能值 Strict - 仅允许当前页面 URL 与请求 URL 完全一致时携带,Lax - 允许部分携带,None - 无论是否跨站都允许携带。从 Chrome 80 开始,默认值从 None 改为了 Lax,这可能会影响到很多依赖 Cookie 网站的正常工作,在网上也可以看到不少相关的讨论。解决该问题的方法是收到将所有 Cookie 设置 SameSite=None,同时需要注意的是需要设置 Secure 才会生效。Lax 的规则有些复杂,更详细的内容推荐阅读这篇文章这篇文章

由于 ; , 空格 在 Cookie 中有特殊含义,所以当存储的数据中包含这些特殊字符时,需要在存储前通过 encodeURIComponent 进行编码,读取前通过 decodeURIComponent 进行解码。

优点:

  • 适合用于存放需要每个请求都必须携带的数据
  • 服务端也可以直接操作 Cookie
  • 可以通过 domain 以及 path 控制数据存储的范围

缺点:

  • 容量有限,规范只要求每个域名下最低提供 4kb 的存储空间
  • 每次请求都会携带,如果存放了大量不必要的数据很显然会影响页面性能
  • 不安全,永远不要在 Cookie 中存放用户的敏感数据
  • 前端 API 不友好,CRUD 都是通过 document.cookie 进行,没有提供相关操作的方法

WebStorage

WebStorage 是什么

WebStorage 是 HTML5 新增的客户端存储机制,分为 LocalStorage 以及 SessionStorage,IE8+ 以及各现代浏览器对其都有良好的支持。

WebStorage SPEC

LocalStorage

永久存储(除非浏览器缓存被清除)在当前域下,遵循同源策略。

如果在一个浏览器打开多个窗口访问同一域名的网站,那么这多个窗口中的 LocalStorage 是共享的。

SessionStorage

存储周期为当前 Session ,同样遵循同源策略。

需要注意这里的 Session 和 Cookie 的默认存储 Session 不同,SessionStorage 针对的是浏览器的每个窗口,而不是整个浏览器的进程。

正因如此,与 LocalStorage 不同的是,多个窗口下的同域名网站,其 SessionStorage 也是分开存储的。

Ps:要注意的是如果在一个窗口内访问的网站通过 <iframe> 内嵌了俩个同域名网站,那么这俩个 <iframe> 内嵌站点的 SessionStorage 是共享的。

API

// sessionStorage 与 localStorage 一致
localStorage.a = 'test1' // 新增或修改
localStorage.a // 读取
localStorage['a'] // 读取

localStorage.setItem(a, 'test3') // 新增
localStorage.getItem(a) // 读取
localStorage.removeItem(a) // 删除
localStorage.clear() // 清空所有
localStorage.key(index) // 获取指定 index 存储键值对的 key
localStorage.length // 总共存储的键值对数量

Storage Event

WebStorage 还提供了事件机制,用于监听存储发生的变化。

当打开俩个窗口访问同域网站,如果在其中一个窗口中修改了存储数据,在另一个窗口中可以通过如下代码监听到存储改变的事件:

// 会被 setItem() removeItem() clear() 触发
window.addEventListener('storage', e => {
    /**
        e: {
            key, // 发生改变的 key
            newValue, // 旧值
            oldValue, // 新值
            url, // 触发变化的文档 URL
            ...
        }
    */
    // 当事件是由 clear() 触发时 key/newVlue/oldValue 都为 null
})

要注意的是这个事件只有在本地存储真的发生变化时才会触发。

也就是说假设已经通过 localStorage.a = 'test' 设置了本地存储中 a 的值为 test,那么再次执行 localStorage.a = 'test' 并不会触发该事件。

并且通过 localStorage.removeItem('notExist') 试图移除一个不存在的属性时也不会触发事件。

Ps:(由于 SessionStorage 是基于浏览器窗口存储,所以只有当使用 <iframe> 处理内嵌页面时才可能会触发事件)

这个机制可以用于实现应用的广播功能,当用户在一个窗口的页面进行操作时同步对另一个窗口的页面做出修改。例如用户在一个窗口中修改了应用的主题色,我们通过 localStorage.color = 'red' 来保存这一改变,另一个窗口通过监听到 localStorage 的变化同步的将应用的主题色也修改为 red

WebStorage 的优势

  • 每个域下允许存储超过 5Mb 的数据(各个浏览器有所不同 Ps: Chrome 目前最多能存储 5Mb 数据,另外 LocalStorage 与 SessionStorage 应该是分开存储的。)
  • 更友好的 API

WebStroge 可不可以完全替代 Cookies ?

就目前来看,答案是不能。

首先一点服务端无法操作 WebStorage,这就意味着起码用户登录鉴权相关的信息还是通过 Cookies 更合适。

其次,WebStorage 严格遵循同源策略,意味着类似目前互联网上应用广泛的第三方广告系统仍只能依赖 Cookies 来实现。

个人认为 WebStorage 的适用场景在于前端持久化一些与后端无关的数据,例如把用户正在填写的表单数据进行缓存/存储一些针对每个用户不同使用习惯的个性化配置数据等。

其它注意事项

  • 不管是 Cookie 还是 WebStorage 都是与浏览器相关的,也就意味着在 Chrome 浏览器中存储的数据,当用户切换为 FireFox 浏览时就无法获取,当然这应该是小概率事件,毕竟大多数人习惯于使用同一种浏览器。

  • 当浏览器设置 Cookie 失败时并不会报错,这个过程是静默的。例如当你试图跨域的去设置 Cookie 时只会发现不生效,但不会在控制台中看到相应错误信息。

  • 虽然 WebStorage 的规范希望能支持对类似数组对象等结构化数据进行存储,但目前为止大多数浏览器仅支持字符串作为 Value,传入非字符串的值会被强制转化为字符串。例如试图通过 localStorage.o = {a: 1} 存储一个对象,会发现实际存储的是 o: "[object Object]"

  • WebStorage 的读取是同步操作,所以数据量大时会阻塞浏览器的主线程。

参考文档