第一部分 BJSON 与 JSON
MongoDB的文档
与JavaScript中的对象很相似,JavaScript中的数据交互格式是JSON格式
.
JSON的数据格式:
1. null;2. 布尔;3. 数字;4. 字符串;5. 数据;6. 对象。
那么我们一直所说的JSON代表的究竟是什么❓
Mongodb所谓的相似的的格式什么❓
1.1 JSON 是什么❓
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,以文字为基础,且易于让人阅读。尽管JSON是Javascript的一个子集,但JSON是独立
于语言
的文本格式
.
JSON 数据格式与语言无关
,脱胎于 JavaScript,但目前很多编程语言都支持 JSON 格式数据的生成和解析。JSON 的官方 MIME 类型是 application/json
,文件扩展名是.json。
JSON建构于两种结构:
1. 对象(object):一个对象以“{”开始,并以“}”结束。一个对象包含一系列非排序的名称/值对,每个名称/值对之间使用“,”分区。
2. 名称/值(collection):名称和值之间使用“:”隔开,一般的形式是:{name:value}
1.2 BJSON
BSON( Binary Serialized Document Format)
(Binary JSON)是一种二进制形式的存储格式
,采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象
,具有轻量性
、可遍历性
、高效性
的特点,可以有效描述非结构化数据
和结构化数据
。
BJSON 分类
1. String:字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。2. Integer:整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。3. Boolean:布尔值。用于存储布尔值(真/假)。4. Double:双精度浮点值。用于存储浮点值。5. Min/Max keys:将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。6. Arrays:用于将数组或列表或多个值存储为一个键。7. Timestamp:时间戳。记录文档修改或添加的具体时间。8. Object:用于内嵌文档。9. Null:用于创建空值。10. Symbol:符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。11. Date:日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。12. Object ID:对象 ID。用于创建文档的 ID。13. Binary Data:二进制数据。用于存储二进制数据。14. Code:代码类型。用于在文档中存储 JavaScript 代码。15. Regular expression:正则表达式类型。用于存储正则表达式。
第二部分 插入文档
当执行插入的时候,使用的驱动程序会将数据装换成BJSON形式,然后插入进数据库.
2.1 插入文档
MongoDB提供了如下方法向集合插入 documents :
1. db.collection.insertOne()
2. db.collection.insertMany()
3. db.collection.insert()
实例代码
> db.users.insertOne(... {... name: "sue",... age: 19,... status: "P"... }... )
{ "acknowledged" : true, "insertedId" : ObjectId("5871f4958aebfde452a9207e")
}
> db.users.insertMany(... [... { name: "bob", age: 42, status: "A", },... { name: "ahn", age: 22, status: "A", },... { name: "xi", age: 34, status: "D", }... ]... )
{ "acknowledged" : true, "insertedIds" : [
ObjectId("5871f49e8aebfde452a9207f"),
ObjectId("5871f49e8aebfde452a92080"),
ObjectId("5871f49e8aebfde452a92081")
]
}
> db.users.insert(... {... name: "sue",... age: 19,... }... )
WriteResult({ "nInserted" : 1 })
>
第三部分 文档中的ObjectId解析
不论是我们插入文档还是筛选数据, 都会有个_id字段, value 为 ObjectId("5871f4958aebfde452a9207e"),那么这个24位的字符串
究竟什么东西?
> db.users.find()
{ "_id" : ObjectId("5871f4958aebfde452a9207e"), "name" : "sue", "age" : 19, "status" : "P" }
为了考虑分布式,“_id”要求不同的机器都能用全局唯一
的同种方法方便的生成它。因此不能使用自增主键
(需要多台服务器进行同步,既费时又费力),因此选用了生成ObjectId对象的方法。
实际上它是由一组十六进制的字符构成,每个字节``两位
的十六进制数字
,总共用了12字节
的存储空间。
屏幕快照 2017-01-09 上午9.47.27.png
1. 时间戳: 前四个字节,也就是前八位--5871f495,转为十进制--1483863189,
2. 机器ID: 机器主机名的散列值, 确保了不同主机生成不同的机器hash值,确保在分布式中不造成冲突,这也就是在同一台机器生成的objectId中间的字符串都是一模一样的原因。
3. PID。上面的Machine是为了确保在不同机器产生的objectId不冲突,而pid就是为了在同一台机器不同的mongodb进程产生了objectId不冲突,
4. 计数器。前面的九个字节是保证了一秒内不同机器不同进程生成objectId不冲突,这后面的三个字节“36236b”是一个自动增加的计数器,用来确保在同一秒内产生的objectId也不会发现冲突,允许256的3次方等于16777216条记录的唯一性。
更多精彩内容请关注“IT实战联盟”哦~~~
注意:本文归作者所有,未经作者允许,不得转载