前言
MongoDB是由C++語(yǔ)言所編寫的一種面向文檔的非關(guān)系型數(shù)據(jù)庫(kù)(是一種NoSql數(shù)據(jù)庫(kù)實(shí)現(xiàn)),也是介于關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型數(shù)據(jù)庫(kù)之間的數(shù)據(jù)存儲(chǔ)產(chǎn)品,而眾所周知SQL與NoSQL最大的不同之一就是不支持JOIN,在傳統(tǒng)的數(shù)據(jù)庫(kù)中,SQL JOIN子句允許你使用普通的字段,在兩個(gè)或者是更多表中的組合表中的每行數(shù)據(jù)。例如,如果你有表books和publishers,你可以像下面這樣寫命令:
SELECT book.title, publisher.name
FROM book
LEFT JOIN book.publisher_id ON publisher.id;
換句話說(shuō),book表中的publisher_id字段引用了publishers表中的id字典。這些都是很常見的例子:對(duì)于每個(gè)publisher都可以擁有成千上萬(wàn)本書,如果你想更新publisher的信息的時(shí)候,我們只需要更改一條記錄。數(shù)據(jù)的冗余是很小的,因?yàn)槲覀儾恍枰獮槊勘緯鴣?lái)重復(fù)更新他的publisher信息,這種技術(shù)已基本當(dāng)做一種規(guī)范化的東西了。SQL數(shù)據(jù)庫(kù)提供了一些列的規(guī)范與約束條件來(lái)保障數(shù)據(jù)關(guān)聯(lián)性。
--------------------------------------------------------------------------------
NoSQL == No JOIN?
并不都是這樣吧。。。。。
--------------------------------------------------------------------------------
面向文檔的數(shù)據(jù)庫(kù),例如MongoDB,被設(shè)計(jì)用來(lái)存儲(chǔ)非結(jié)構(gòu)化的數(shù)據(jù),理想情況下,這些數(shù)據(jù)是在數(shù)據(jù)集合中是相互沒有關(guān)聯(lián)的,如果一條數(shù)據(jù)包含兩次或者更多次,那數(shù)據(jù)就重復(fù)了。因?yàn)榇蟛糠智闆r下我們還是需要數(shù)據(jù)關(guān)聯(lián)的,只有很少的情況下才會(huì)不需要關(guān)聯(lián)數(shù)據(jù),看來(lái)NoSQL這些特性看來(lái)讓人失望啊。幸運(yùn)的是MongoDB 3.2 介紹了一個(gè)新的$lookup操作,這個(gè)操作可以提供一個(gè)類似于LEFT OUTER JOIN的操作在兩個(gè)或者是更多的條件下。
--------------------------------------------------------------------------------
MongoDB Aggregation
$lookup僅僅在 aggregation操作中才被允許使用,想想他作為一個(gè)管道操作:查詢,過(guò)濾,組合結(jié)果。一個(gè)操作的輸出被作為下一個(gè)的輸入。Aggregation比簡(jiǎn)單的查詢操作更難于理解,而且這些操作通常運(yùn)行很慢,然而他們很高效,Aggregation可以使用一個(gè)很好的例子來(lái)解釋,假設(shè)我們使用user數(shù)據(jù)集合來(lái)創(chuàng)建一個(gè)社交平臺(tái),在每個(gè)獨(dú)立的文檔中存儲(chǔ)沒個(gè)用戶的信息,例如:
{
"_id": ObjectID("45b83bda421238c76f5c1969"),
"name": "User One",
"email: "userone@email.com",
"country": "UK",
"dob": ISODate("1999-09-13T00:00:00.000Z")
}
我們可以向user這個(gè)集合中添加足夠多的用戶,但是每個(gè)MongoDB文檔都必須有一個(gè)為一個(gè)_id字段值,這個(gè)_id字段值就像SQL中的鍵,在我們沒有明確指定_id的時(shí)候會(huì)被自動(dòng)的加入到文檔中。我們的社交網(wǎng)站現(xiàn)在需要一個(gè)post集合,這個(gè)結(jié)合存儲(chǔ)用戶的評(píng)論,這個(gè)文檔存儲(chǔ)純文本,時(shí)間,評(píng)分,一個(gè)被寫到user_id字段的玩家引用。
{
"_id": ObjectID("17c9812acff9ac0bba018cc1"),
"user_id": ObjectID("45b83bda421238c76f5c1969"),
"date: ISODate("2016-09-05T03:05:00.123Z"),
"text": "My life story so far",
"rating": "important"
}
我們現(xiàn)在想要顯示最近具有important評(píng)論的二十條數(shù)據(jù),這些數(shù)據(jù)來(lái)自所有的用戶,并且是按照時(shí)間排序的。每一個(gè)返回的文檔中應(yīng)該包含評(píng)論的文本,發(fā)布評(píng)論的時(shí)間,以及相關(guān)的用戶的名字和國(guó)家。
MongoDB數(shù)據(jù)庫(kù)的aggregate查詢是通過(guò)傳遞管道操作的數(shù)組,這個(gè)數(shù)組中順序的定了每個(gè)操作。首先,我們需要從所有的post集合中提取出所有的文檔,這些文檔使用$match記性準(zhǔn)確rating過(guò)濾。
{ "$match": { "rating": "important" } }
我們現(xiàn)在需要對(duì)過(guò)濾出來(lái)的文檔按照時(shí)間,使用$sort操作進(jìn)行排序。
{ "$sort": { "date": -1 } }
因?yàn)槲覀円獌H僅返回二十條數(shù)據(jù),我們可以使用$limit來(lái)限制我們需要處理的文檔數(shù)量。
我們現(xiàn)在使用$lookup操作從user集合中連接數(shù)據(jù),這個(gè)操作需要一個(gè)四個(gè)參數(shù)的對(duì)象:
1、localField:在輸入文檔中的查找字段
2、from:需要連接的集合
3、foreignField:需要在from集合中查找的字段
4、as:輸出的字段名字
所以我們的操作是這樣的:
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} }
在我們的輸出中將會(huì)創(chuàng)建一個(gè)名為userinfo的新字段,他是一個(gè)數(shù)組,其中每個(gè)元素都是在user集合中匹配的元素。
"userinfo": [
{ "name": "User One", ... }
]
在post.user_id與user._id之間,我們具有一對(duì)一的關(guān)系,因?yàn)閷?duì)于每一個(gè)post只有一個(gè)用戶。因此我們的userinfo數(shù)組將會(huì)僅僅包含一個(gè)元素,我們可以說(shuō)使用 $unwind操作來(lái)解構(gòu)他并插入到一個(gè)自文檔中。
{ "$unwind": "$userinfo" }
現(xiàn)在的輸出將會(huì)轉(zhuǎn)化成更加常用的結(jié)構(gòu):
"userinfo": {
"name": "User One",
"email: "userone@email.com",
…
}
最終我們可以在管道中使用 $project操作返回評(píng)論信息,評(píng)論的時(shí)間,評(píng)論的用戶名,國(guó)家等。
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
合并上面所有的操作
我們最終的聚合查詢匹配的評(píng)論,按照順序排序,限制最新的二十條信息,連接用戶的數(shù)據(jù),扁平用戶數(shù)組,最后只返回我們需要的必須數(shù)據(jù),總的命令如下:
db.post.aggregate([
{ "$match": { "rating": "important" } },
{ "$sort": { "date": -1 } },
{ "$limit": 20 },
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} },
{ "$unwind": "$userinfo" },
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
]);
結(jié)果是一個(gè)擁有二十個(gè)文檔的集合,例如:
[
{
"text": "The latest post",
"date: ISODate("2016-09-27T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
},
{
"text": "Another post",
"date: ISODate("2016-09-26T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
}
...
]
MongoDB的$lookup很好用而且很高效,但是上面這個(gè)基礎(chǔ)的例子只是一個(gè)組合的集合查詢。他不是一個(gè)對(duì)SQL中的更加高效的JOIN子句的替代。而且MongoDB也提供了一些限制,如果user集合被刪除了,post文檔還是會(huì)保留。
理想情況下,這個(gè)$lookup操作應(yīng)該不會(huì)經(jīng)常使用,如果你需要經(jīng)常使用它,那么你就使用了錯(cuò)誤的數(shù)據(jù)存儲(chǔ)了(數(shù)據(jù)庫(kù)):如果你有相關(guān)聯(lián)的數(shù)據(jù),應(yīng)該使用關(guān)聯(lián)數(shù)據(jù)庫(kù)(SQL)。
也就是說(shuō)$lookup是一個(gè)MongoDB 3.2新加入的,他解決了當(dāng)在Nosql數(shù)據(jù)庫(kù)中使用一些小的相關(guān)聯(lián)的數(shù)據(jù)查詢的時(shí)候一些令人失望的問題。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來(lái)一定的幫助,如果有疑問大家可以留言交流,謝謝大家對(duì)腳本之家的支持。
您可能感興趣的文章:- MongoDB 語(yǔ)法使用小結(jié)
- windows下mongodb安裝與使用圖文教程(整理)
- MongoDB索引使用詳解
- MongoDB入門教程(包含安裝、常用命令、相關(guān)概念、使用技巧、常見操作等)
- MongoDB 使用Skip和limit分頁(yè)
- CentOS 6.5系統(tǒng)中使用yum安裝MongoDB 2.6 教程
- MongoDB中的bson介紹和使用實(shí)例
- mongodb數(shù)據(jù)庫(kù)游標(biāo)的使用淺析
- mongodb使用心得簡(jiǎn)單總結(jié)
- mongodb BSON的基本使用教程