13日 十一月 2019

Blob

ArrayBuffer 和视图(views)都是 JavaScript 中 ECMA 标准的一部分。

我们在 File API 一节中描述过,在浏览器中,有其他高阶对象,特别是 Blob

Blob 由一个可选的字符串 type (通常是 MIME 类型) 和 blobParts 组成 – 一串其他 Blob 对象、字符串和 BufferSources

构造函数的语法为:

new Blob(blobParts, options);
  • blobParts Blob/BufferSource/String 类型值的数组。
  • options 可选对象:
    • type – blob 类型,通常是 MIME 类型,如 image/png
    • endings – 是否转换换行符,使 blob 符合当前操作系统的换行符(\r\n\n)。默认为 "transparent"(啥也不做),不过也可以是 "native"(转换)。

例如:

// 从字符串创建 blob
let blob = new Blob(["<html>…</html>"], {type: 'text/html'});
// 请注意:第一个参数值必须是数组 [...]
// 从类型数组(typed array)和字符串创建 blob
let hello = new Uint8Array([72, 101, 108, 108, 111]); // 二进制格式的 "hello"

let blob = new Blob([hello, ' ', 'world'], {type: 'text/plain'});

我们可以用 slice 方法来提取 blob 分段:

blob.slice([byteStart], [byteEnd], [contentType]);
  • byteStart – 起始字节,默认为 0。
  • byteEnd – 最后一个字节(不包括之,默认为最后)。
  • contentType – 新 blob 的 type,默认与源 blob 相同。

参数值与 array.slice 相同,也允许负数。

Blob 是不可改变的

我们不能直接在 blob 中更改数据,但可以切割成多个部分,从每一部分创建新的 blobs,将他们组成新的 blob,以此类推。

这种行为类似于 JavaScript 字符串:我们无法更改字符串中的字符,但可以生成一个新的改动过的字符串。

Blob 作为 URL

Blob 可以很容易当做 URL 用于 <a><img> 或其他标记(tags),来显示其内容。

有了 type,我们也可以下载/上传 blobs,很自然的便成了网络请求中的 Content-Type

让我们来看一个简单的例子。通过
点击一个链接,下载一个动态生成的 blob,文件内容是 hello world

<!-- download 属性使浏览器下载而非浏览 -->
<a download="hello.txt" href='#' id="link">Download</a>

<script>
let blob = new Blob(["Hello, world!"], {type: 'text/plain'});

link.href = URL.createObjectURL(blob);
</script>

我们也可以在 Javascript 中动态创建一个链接,通过 link.click() 模拟一个点击(click),然后便自动下载了。

以下是示例代码,用户无需任何 HTML 即可下载动态生成的 Blob:

let link = document.createElement('a');
link.download = 'hello.txt';

let blob = new Blob(['Hello, world!'], {type: 'text/plain'});

link.href = URL.createObjectURL(blob);

link.click();

URL.revokeObjectURL(link.href);

URL.createObjectURL 接受一个 blob,为其创建一个唯一的 URL,格式是 blob:<origin>/<uuid>

link.href 的值就像这样:

blob:https://javascript.info/1e67e00e-860d-40a5-89ae-6ab0cbee6273

浏览器内部为每个通过 URL.createObjectURL 生成的 url 存储了一个 url → blob 映射。因此,这些 url 虽然短小,但可以访问 blob。

生成的 url(即其链接)只在当前文档打开的状态下才有效。它允许引用 <img><a> 中的 blob,以及基本上任何其他接受 url 的对象。

不过有个问题是,当 blob 有映射的时候,blob 本身是在内存中的。浏览器无法释放它。

在文档退出时,该映射会被自动清除,因此 blob 也相应被释放了。但是如果应用程序长时间工作时,这个释放工作就不会很快发生了。

因此,如果我们要创建一个 URL,那个 blob 会长留在内存中,即使已不再需要了。

URL.revokeObjectURL(url) 从内部映射中删除引用,因此允许删除 blob(如果没有其他引用的话),并从内存中释放。

在上一个示例中,为了快速下载,我们想只用一次 blob,因此我们立刻调用 URL.revokeObjectURL(link.href)

而在前一个示例中,利用可以点击的 HTML 链接,我们不调用 URL.revokeObjectURL(link.href),因为那样会使 blob url 无效。在撤销后,由于映射被删除了,因此 url 也不再有效了。

Blob 转换为 base64

URL.createObjectURL 的一个可替代方法是,将 blob 转换为 base64-编码 的字符串。

这种编码是将二进制数据表示为一个由 0 到 64 的 ASCII 码字符组成的字符串,非常安全且“可读“。而且更重要的是 – 我们可以在数据 url 中使用此编码。

数据 url(data url) 的格式是 data:[<mediatype>][;base64],<data>。我们可以在其他地方使用这种 url,如同使用 “普通” urls 一样。

例如,这是一个笑容符:

<img src="">

浏览器将字符串解码,显示图像:

我们用自带的 FileReader 对象将 blob 转换为 base64。它可以从 Blobs 读取为多种格式的数据。在下一章 我们会做深入讲解。

以下是下载 blob 的示例代码,这次是通过 base-64 来实现:

let link = document.createElement('a');
link.download = 'hello.txt';

let blob = new Blob(['Hello, world!'], {type: 'text/plain'});

let reader = new FileReader();
reader.readAsDataURL(blob); // 将 blob 转换为 base64 并调用 onload 方法

reader.onload = function() {
  link.href = reader.result; // data url
  link.click();
};

这两种从 blob 创建 URL 的方法都可以用。但通常 URL.createObjectURL(blob) 更简单快捷一些。

URL.createObjectURL(blob)
  • 如介意内存,我们需要撤销他们
  • 直接访问 blob,无需”编码/解码“
Blob 转换为 数据 url
  • 无需撤销任何操作。
  • 大的 blob 编码时,性能和内存会有损耗。

Image 转换为 blob

我们可以从图像(image)、图像的一部分或甚至一个页面截图来创建 blob。这样便方便上传到其他地方。

Image 操作是通过 <canvas> 元素来实现:

  1. canvas.drawImage在画布上画一个图像(或其中的一部分)。
  2. 调用 canvas 方法 .toBlob(callback, format, quality),创建一个 blob,并在创建后运行 callback

在上例中,图像只是被复制(copy)了,不过我们可以在创建 blob 之前,在画布上进行剪裁(cut),或转换(transform):

// 获取任何图像
let img = document.querySelector('img');

// 生成同尺寸的 <canvas>
let canvas = document.createElement('canvas');
canvas.width = img.clientWidth;
canvas.height = img.clientHeight;

let context = canvas.getContext('2d');

// 复制图像(此方法允许剪裁图像)
context.drawImage(img, 0, 0);
// 我们可以在画布上 context.rotate(),以及许多其他操作。

// toBlob 是异步操作,结束后会调用 callback
canvas.toBlob(function(blob) {
  // blob 创建完毕后,下载之
  let link = document.createElement('a');
  link.download = 'example.png';

  link.href = URL.createObjectURL(blob);
  link.click();

  // 删除内部 blob 引用,这样浏览器可以从内存中将其删除
  URL.revokeObjectURL(link.href);
}, 'image/png');

如果我们想用 async/await 取代 callbacks:

let blob = await new Promise(resolve => canvasElem.toBlob(resolve, 'image/png'));

对于页面截屏,我们可以用一个库如 https://github.com/niklasvh/html2canvas。它做的事情是,在页面上扫一遍,并在 <canvas> 上画下来。然后我们便可以如上述操作一样从中获取 blob。

Blob 转换为 ArrayBuffer

Blob 构造函数允许从几乎任何对象创建 blob,包括任何 BufferSource

但如果我们需要做底层操作的话,我们可以用 FileReader 从 blob 中获取最底层的 ArrayBuffer

// 从 blob 获取 arrayBuffer
let fileReader = new FileReader();

fileReader.readAsArrayBuffer(blob);

fileReader.onload = function(event) {
  let arrayBuffer = fileReader.result;
};

总结

ArrayBufferUint8Array 和其他 BufferSource 是“二进制数据”,Blob 则表示“带类型的二进制数据”。

这样可以方便 blob用于在浏览器中非常普遍使用的上传/下载操作。

XMLHttpRequest, 文章 "fetch-basics" 未找到 等进行网络请求的方法可以自然的使用 Blob,如同使用其他二进制类型数据一样。

Blob 和底层二进制数据类型之间的转换也很容易:

  • 我们可以用 new Blob(...) 构造函数从一个类型数组(typed array)创建 blob。
  • 我们可以用 FileReader 从 Blob 中取回 ArrayBuffer,然后在其上创建一个视图(view),用于底层二进制操作。
教程路线图

评论

在评论之前先阅读本内容…
  • 如果你发现教程有错误,或者有其他需要修改和提升的地方 — 请 提交一个 GitHub issue 或 pull request,而不是在这评论。
  • 如果你对教程的内容有不理解的地方 — 请详细说明。
  • 使用 <code> 标签插入只有几个词的代码,插入多行代码可以使用 <pre> 标签,对于超过 10 行的代码,建议你使用沙箱(plnkrJSBincodepen…)