目錄
成都創(chuàng)新互聯(lián)公司是一家專(zhuān)業(yè)提供海南州企業(yè)網(wǎng)站建設(shè),專(zhuān)注與成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè)、H5響應(yīng)式網(wǎng)站、小程序制作等業(yè)務(wù)。10年已為海南州眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專(zhuān)業(yè)網(wǎng)站制作公司優(yōu)惠進(jìn)行中。
- 數(shù)據(jù)庫(kù)分類(lèi)維度:關(guān)系型/非關(guān)系型、交易型/分析型
- NoSQL數(shù)據(jù)庫(kù)的進(jìn)一步分類(lèi)
- OLTP市場(chǎng)規(guī)模:關(guān)系型數(shù)據(jù)庫(kù)仍占營(yíng)收大頭
- 數(shù)據(jù)庫(kù)市場(chǎng)份額:云服務(wù)和新興廠商主導(dǎo)NoSQL
- 開(kāi)源數(shù)據(jù)庫(kù) vs. 商業(yè)數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)三大陣營(yíng):傳統(tǒng)廠商和云服務(wù)提供商
最近由于時(shí)間原因我寫(xiě)東西少了,在公眾號(hào)上也轉(zhuǎn)載過(guò)幾篇搞數(shù)據(jù)庫(kù)朋友的大作。按說(shuō)我算是外行,沒(méi)資格在這個(gè)領(lǐng)域品頭論足,而當(dāng)我看到下面這份報(bào)告時(shí)立即產(chǎn)生了學(xué)習(xí)的興趣,同時(shí)也想就能看懂的部分寫(xiě)點(diǎn)心得體會(huì)分享給大家。
可能本文比較適合普及性閱讀,讓數(shù)據(jù)庫(kù)領(lǐng)域資深的朋友見(jiàn)笑了:)
數(shù)據(jù)庫(kù)分類(lèi)維度:關(guān)系型/非關(guān)系型、交易型/分析型
首先是分類(lèi)維度,上圖中的縱軸分類(lèi)為Relational Database(關(guān)系型數(shù)據(jù)庫(kù),RDBMS)和Nonrelational Database (非關(guān)系型數(shù)據(jù)庫(kù),NoSQL),橫軸的分類(lèi)為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。
按照習(xí)慣我們先看關(guān)系型數(shù)據(jù)庫(kù),左上角的交易型類(lèi)別中包括大家熟悉的商業(yè)數(shù)據(jù)庫(kù)Oracle、MS SQL Server、DB2、Infomix,也包括開(kāi)源領(lǐng)域流行的MySQL(MariaDB是它的一個(gè)分支)、PostgreSQL,還有云上面比較常見(jiàn)的SQL Azure和Amazon Aurora等。
比較有意思的是,SAP HANA正好位于交易型和分析型的中間分界處,不要忘了SAP還收購(gòu)了Sybase,盡管后者今天不夠風(fēng)光了,而早年微軟的SQL Server都是來(lái)源于Sybase。Sybase的ASE數(shù)據(jù)庫(kù)和分析型Sybase IQ還是存在的。
右上角的分析型產(chǎn)品中包括幾款知名的列式數(shù)據(jù)倉(cāng)庫(kù)Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來(lái)自互聯(lián)網(wǎng)巨頭的Google Big Query和Amazon RedShift。至于Oracle Exadata一體機(jī),它上面運(yùn)行的也是Oracle數(shù)據(jù)庫(kù),其最初設(shè)計(jì)用途是OLAP,而在后來(lái)發(fā)展中也可以良好兼顧OLTP,算是一個(gè)跨界產(chǎn)品吧。
再來(lái)看非關(guān)系型數(shù)據(jù)庫(kù),左下角的交易型產(chǎn)品中,有幾個(gè)我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產(chǎn)品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已并購(gòu)),Bigtable(來(lái)自Google,Hadoop中的HBase是它的開(kāi)源實(shí)現(xiàn))、Elasticsearch等。
顯然非關(guān)系型數(shù)據(jù)庫(kù)的分類(lèi)要更加復(fù)雜,產(chǎn)品在應(yīng)用中的差異化也比傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)更大。Willian Blair很負(fù)責(zé)任地對(duì)它們給出了進(jìn)一步的分類(lèi)。
NoSQL數(shù)據(jù)庫(kù)的進(jìn)一步分類(lèi)
上面這個(gè)圖表應(yīng)該說(shuō)很清晰了。非關(guān)系型數(shù)據(jù)庫(kù)可以分為Document-based Store(基于文檔的存儲(chǔ))、Key-Value Store(鍵值存儲(chǔ))、Graph-based(圖數(shù)據(jù)庫(kù))、Time Series(時(shí)序數(shù)據(jù)庫(kù)),以及Wide Cloumn-based Store(寬列式存儲(chǔ))。
我們?cè)賮?lái)看下每個(gè)細(xì)分類(lèi)別中的產(chǎn)品:
文檔存儲(chǔ) :MongoDB、Amazon DocumentDB、Azure Cosmos DB等
Key-Value存儲(chǔ) :Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等
圖數(shù)據(jù)庫(kù) :Neo4j等
時(shí)序數(shù)據(jù)庫(kù) :InfluxDB等
WideCloumn :DataStax、Cassandra、Apache HBase和Bigtable等
多模型數(shù)據(jù)庫(kù) :支持上面不只一種類(lèi)別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。
OLTP市場(chǎng)規(guī)模:關(guān)系型數(shù)據(jù)庫(kù)仍占營(yíng)收大頭
上面這個(gè)基于IDC數(shù)據(jù)的交易型數(shù)據(jù)庫(kù)市場(chǎng)份額共有3個(gè)分類(lèi),其中深藍(lán)色部分的關(guān)系型數(shù)據(jù)庫(kù)(RDBMS,在這里不統(tǒng)計(jì)數(shù)據(jù)挖掘/分析型數(shù)據(jù)庫(kù))占據(jù)80%以上的市場(chǎng)。
Dynamic Database(DDMS,動(dòng)態(tài)數(shù)據(jù)庫(kù)管理系統(tǒng),同樣不統(tǒng)計(jì)Hadoop)就是我們前面聊的非關(guān)系型數(shù)據(jù)庫(kù)。這部分市場(chǎng)顯得?。ǖl(fā)展勢(shì)頭看好),我覺(jué)得與互聯(lián)網(wǎng)等大公司多采用開(kāi)源+自研,而不買(mǎi)商業(yè)產(chǎn)品有關(guān)。
而遵循IDC的統(tǒng)計(jì)分類(lèi),在上圖灰色部分的“非關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)”其實(shí)另有定義,參見(jiàn)下面這段文字:
數(shù)據(jù)庫(kù)市場(chǎng)份額:云服務(wù)和新興廠商主導(dǎo)NoSQL
請(qǐng)注意,這里的關(guān)系型數(shù)據(jù)庫(kù)統(tǒng)計(jì)又包含了分析型產(chǎn)品。Oracle營(yíng)收份額42%仍居第一,隨后排名依次為微軟、IBM、SAP和Teradata。
代表非關(guān)系型數(shù)據(jù)庫(kù)的DDMS分類(lèi)中(這里同樣加入Hadoop等),云服務(wù)和新興廠商成為了主導(dǎo),微軟應(yīng)該是因?yàn)樵芐QL Server的基礎(chǔ)而小幅領(lǐng)先于AWS,這2家一共占據(jù)超過(guò)50%的市場(chǎng),接下來(lái)的排名是Google、Cloudera和Hortonworks(二者加起來(lái)13%)。
上面是IDC傳統(tǒng)分類(lèi)中的“非關(guān)系型數(shù)據(jù)庫(kù)”,在這里IBM和CA等應(yīng)該主要是針對(duì)大型機(jī)的產(chǎn)品,InterSystems有一款在國(guó)內(nèi)醫(yī)療HIS系統(tǒng)中應(yīng)用的Caché數(shù)據(jù)庫(kù)(以前也是運(yùn)行在Power小機(jī)上比較多)。我就知道這些,余下的就不瞎寫(xiě)了。
開(kāi)源數(shù)據(jù)庫(kù) vs. 商業(yè)數(shù)據(jù)庫(kù)
按照流行度來(lái)看,開(kāi)源數(shù)據(jù)庫(kù)從2013年到現(xiàn)在一直呈現(xiàn)增長(zhǎng),已經(jīng)快要追上商業(yè)數(shù)據(jù)庫(kù)了。
商業(yè)產(chǎn)品在關(guān)系型數(shù)據(jù)庫(kù)的占比仍然高達(dá)60.5%,而上表中從這列往左的分類(lèi)都是開(kāi)源占優(yōu):
Wide Cloumn:開(kāi)源占比81.8%;
時(shí)序數(shù)據(jù)庫(kù):開(kāi)源占比80.7%;
文檔存儲(chǔ):開(kāi)源占比80.0%;
Key-Value存儲(chǔ):開(kāi)源占比72.2%;
圖數(shù)據(jù)庫(kù):開(kāi)源占比68.4%;
搜索引擎:開(kāi)源占比65.3%
按照開(kāi)源License的授權(quán)模式,上面這個(gè)三角形越往下管的越寬松。比如MySQL屬于GPL,在互聯(lián)網(wǎng)行業(yè)用戶(hù)較多;而PostgreSQL屬于BSD授權(quán),國(guó)內(nèi)有不少數(shù)據(jù)庫(kù)公司的產(chǎn)品就是基于Postgre哦。
數(shù)據(jù)庫(kù)三大陣營(yíng):傳統(tǒng)廠商和云服務(wù)提供商
前面在討論市場(chǎng)份額時(shí),我提到過(guò)交易型數(shù)據(jù)庫(kù)的4個(gè)巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營(yíng)。
隨著云平臺(tái)的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個(gè)陣營(yíng),在國(guó)外分析師的眼里還沒(méi)有BAT,就像有的朋友所說(shuō),國(guó)內(nèi)互聯(lián)網(wǎng)巨頭更多是自身業(yè)務(wù)導(dǎo)向的,在本土發(fā)展公有云還有些優(yōu)勢(shì),短時(shí)間內(nèi)將技術(shù)輸出到國(guó)外的難度應(yīng)該還比較大。(當(dāng)然我并不認(rèn)為國(guó)內(nèi)缺優(yōu)秀的DBA和研發(fā)人才)
第三個(gè)陣容就是規(guī)模小一些,但比較專(zhuān)注的數(shù)據(jù)庫(kù)玩家。
接下來(lái)我再帶大家簡(jiǎn)單過(guò)一下這前兩個(gè)陣容,看看具體的數(shù)據(jù)庫(kù)產(chǎn)品都有哪些。
甲骨文的產(chǎn)品,我相對(duì)熟悉一些的有Oracle Database、MySQL以及Exadata一體機(jī)。
IBM DB2也是一個(gè)龐大的家族,除了傳統(tǒng)針對(duì)小型機(jī)、x86(好像用的人不多)、z/OS大型機(jī)和for i的版本之外,如今也有了針對(duì)云和數(shù)據(jù)挖掘的產(chǎn)品。記得抱枕大師對(duì)Informix的技術(shù)比較推崇,可惜這個(gè)產(chǎn)品發(fā)展似乎不太理想。
微軟除了看家的SQL Server之外,在Azure云上還能提供MySQL、PostgreSQL和MariaDB開(kāi)源數(shù)據(jù)庫(kù)。應(yīng)該說(shuō)他們是傳統(tǒng)軟件License+PaaS服務(wù)兩條腿走路的。
如今人們一提起SAP的數(shù)據(jù)庫(kù)就想起HANA,之前從Sybase收購(gòu)來(lái)的ASE(Adaptive Server Enterprise)和IQ似乎沒(méi)有之前發(fā)展好了。
在云服務(wù)提供商數(shù)據(jù)庫(kù)的3巨頭中,微軟有SQL Server的先天優(yōu)勢(shì),甚至把它移植到了Linux擁抱開(kāi)源平臺(tái)。關(guān)系型數(shù)據(jù)庫(kù)的創(chuàng)新方面值得一提的是Amazon Aurora和Google Spanner(也有非關(guān)系型特性),至于它們具體好在哪里我就不裝內(nèi)行了:)
非關(guān)系型數(shù)據(jù)庫(kù)則是Amazon全面開(kāi)花,這與其云計(jì)算業(yè)務(wù)發(fā)展早并且占據(jù)優(yōu)勢(shì)有關(guān)。Google當(dāng)年的三篇經(jīng)典論文對(duì)業(yè)界影響深遠(yuǎn),Yahoo基于此開(kāi)源的Hadoop有一段時(shí)間幾乎是大數(shù)據(jù)的代名詞。HBase和Hive如今已不再是人們討論的熱點(diǎn),而B(niǎo)igtable和BigQuery似乎仍然以服務(wù)Google自身業(yè)務(wù)為主,畢竟GCP的規(guī)模比AWS要小多了。
最后這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經(jīng)不是最新的數(shù)據(jù),在這里列出只是給大家一個(gè)參考。該排行榜幾乎在每次更新時(shí),都會(huì)有國(guó)內(nèi)數(shù)據(jù)庫(kù)專(zhuān)家撰寫(xiě)點(diǎn)評(píng)。
以上是我周末的學(xué)習(xí)筆記,班門(mén)弄斧,希望對(duì)大家有幫助。
參考資料《Database Software Market:The Long-Awaited Shake-up》
擴(kuò)展閱讀:《 數(shù)據(jù)庫(kù)存儲(chǔ):互相最想知道的事 》
尊重知識(shí),轉(zhuǎn)載時(shí)請(qǐng)保留全文。感謝您的閱讀和支持!
2. 什么是NoSQL?
2.1 NoSQL 概述
NoSQL(NoSQL = Not Only SQL ),意即“不僅僅是SQL”,
泛指非關(guān)系型的數(shù)據(jù)庫(kù)。隨著互聯(lián)網(wǎng)web2.0網(wǎng)站的興起,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)在應(yīng)付web2.0網(wǎng)站,特別是超大規(guī)模和高并發(fā)的SNS類(lèi)型的web2.0純動(dòng)態(tài)網(wǎng)站已經(jīng)顯得力不從心,暴露了很多難以克服的問(wèn)題,而非關(guān)系型的數(shù)據(jù)庫(kù)則由于其本身的特點(diǎn)得到了非常迅速的發(fā)展。NoSQL數(shù)據(jù)庫(kù)的產(chǎn)生就是為了解決大規(guī)模數(shù)據(jù)集合多重?cái)?shù)據(jù)種類(lèi)帶來(lái)的挑戰(zhàn),尤其是大數(shù)據(jù)應(yīng)用難題,包括超大規(guī)模數(shù)據(jù)的存儲(chǔ)。
(例如谷歌或Facebook每天為他們的用戶(hù)收集萬(wàn)億比特的數(shù)據(jù))。這些類(lèi)型的數(shù)據(jù)存儲(chǔ)不需要固定的模式,無(wú)需多余操作就可以橫向擴(kuò)展。
2.2 NoSQL代表
MongDB、 Redis、Memcache
3. 關(guān)系型數(shù)據(jù)庫(kù)與NoSQL的區(qū)別?
3.1 RDBMS
高度組織化結(jié)構(gòu)化數(shù)據(jù)
結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)
數(shù)據(jù)和關(guān)系都存儲(chǔ)在單獨(dú)的表中。
數(shù)據(jù)操縱語(yǔ)言,數(shù)據(jù)定義語(yǔ)言
嚴(yán)格的一致性
基礎(chǔ)事務(wù)
ACID
關(guān)系型數(shù)據(jù)庫(kù)遵循ACID規(guī)則
事務(wù)在英文中是transaction,和現(xiàn)實(shí)世界中的交易很類(lèi)似,它有如下四個(gè)特性:
A (Atomicity) 原子性
原子性很容易理解,也就是說(shuō)事務(wù)里的所有操作要么全部做完,要么都不做,事務(wù)成功的條件是事務(wù)里的所有操作都成功,只要有一個(gè)操作失敗,整個(gè)事務(wù)就失敗,需要回滾。比如銀行轉(zhuǎn)賬,從A賬戶(hù)轉(zhuǎn)100元至B賬戶(hù),分為兩個(gè)步驟:1)從A賬戶(hù)取100元;2)存入100元至B賬戶(hù)。這兩步要么一起完成,要么一起不完成,如果只完成第一步,第二步失敗,錢(qián)會(huì)莫名其妙少了100元。
C (Consistency) 一致性
一致性也比較容易理解,也就是說(shuō)數(shù)據(jù)庫(kù)要一直處于一致的狀態(tài),事務(wù)的運(yùn)行不會(huì)改變數(shù)據(jù)庫(kù)原本的一致性約束。
I (Isolation) 獨(dú)立性
所謂的獨(dú)立性是指并發(fā)的事務(wù)之間不會(huì)互相影響,如果一個(gè)事務(wù)要訪問(wèn)的數(shù)據(jù)正在被另外一個(gè)事務(wù)修改,只要另外一個(gè)事務(wù)未提交,它所訪問(wèn)的數(shù)據(jù)就不受未提交事務(wù)的影響。比如現(xiàn)有有個(gè)交易是從A賬戶(hù)轉(zhuǎn)100元至B賬戶(hù),在這個(gè)交易還未完成的情況下,如果此時(shí)B查詢(xún)自己的賬戶(hù),是看不到新增加的100元的
D (Durability) 持久性
持久性是指一旦事務(wù)提交后,它所做的修改將會(huì)永久的保存在數(shù)據(jù)庫(kù)上,即使出現(xiàn)宕機(jī)也不會(huì)丟失。
3.2 NoSQL
代表著不僅僅是SQL
沒(méi)有聲明性查詢(xún)語(yǔ)言
沒(méi)有預(yù)定義的模式
鍵 - 值對(duì)存儲(chǔ),列存儲(chǔ),文檔存儲(chǔ),圖形數(shù)據(jù)庫(kù)
最終一致性,而非ACID屬性
非結(jié)構(gòu)化和不可預(yù)知的數(shù)據(jù)
CAP定理
高性能,高可用性和可伸縮性
分布式數(shù)據(jù)庫(kù)中的CAP原理(了解)
CAP定理:
Consistency(一致性), 數(shù)據(jù)一致更新,所有數(shù)據(jù)變動(dòng)都是同步的
Availability(可用性), 好的響應(yīng)性能
Partition tolerance(分區(qū)容錯(cuò)性) 可靠性
P: 系統(tǒng)中任意信息的丟失或失敗不會(huì)影響系統(tǒng)的繼續(xù)運(yùn)作。
定理:任何分布式系統(tǒng)只可同時(shí)滿(mǎn)足二點(diǎn),沒(méi)法三者兼顧。
CAP理論的核心是:一個(gè)分布式系統(tǒng)不可能同時(shí)很好的滿(mǎn)足一致性,可用性和分區(qū)容錯(cuò)性這三個(gè)需求,
因此,根據(jù) CAP 原理將 NoSQL 數(shù)據(jù)庫(kù)分成了滿(mǎn)足 CA 原則、滿(mǎn)足 CP 原則和滿(mǎn)足 AP 原則三 大類(lèi):
CA - 單點(diǎn)集群,滿(mǎn)足一致性,可用性的系統(tǒng),通常在可擴(kuò)展性上不太強(qiáng)大。
CP - 滿(mǎn)足一致性,分區(qū)容忍性的系統(tǒng),通常性能不是特別高。
AP - 滿(mǎn)足可用性,分區(qū)容忍性的系統(tǒng),通??赡軐?duì)一致性要求低一些。
CAP理論就是說(shuō)在分布式存儲(chǔ)系統(tǒng)中,最多只能實(shí)現(xiàn)上面的兩點(diǎn)。
而由于當(dāng)前的網(wǎng)絡(luò)硬件肯定會(huì)出現(xiàn)延遲丟包等問(wèn)題,所以分區(qū)容忍性是我們必須需要實(shí)現(xiàn)的。
所以我們只能在一致性和可用性之間進(jìn)行權(quán)衡,沒(méi)有NoSQL系統(tǒng)能同時(shí)保證這三點(diǎn)。
說(shuō)明:C:強(qiáng)一致性 A:高可用性 P:分布式容忍性
舉例:
CA:傳統(tǒng)Oracle數(shù)據(jù)庫(kù)
AP:大多數(shù)網(wǎng)站架構(gòu)的選擇
CP:Redis、Mongodb
注意:分布式架構(gòu)的時(shí)候必須做出取舍。
一致性和可用性之間取一個(gè)平衡。多余大多數(shù)web應(yīng)用,其實(shí)并不需要強(qiáng)一致性。
因此犧牲C換取P,這是目前分布式數(shù)據(jù)庫(kù)產(chǎn)品的方向。
4. 當(dāng)下NoSQL的經(jīng)典應(yīng)用
當(dāng)下的應(yīng)用是 SQL 與 NoSQL 一起使用的。
代表項(xiàng)目:阿里巴巴商品信息的存放。
去 IOE 化。
ps:I 是指 IBM 的小型機(jī),很貴的,好像好幾萬(wàn)一臺(tái);O 是指 Oracle 數(shù)據(jù)庫(kù),也很貴的,好幾萬(wàn)呢;M 是指 EMC 的存儲(chǔ)設(shè)備,也很貴的。
難點(diǎn):
數(shù)據(jù)類(lèi)型多樣性。
數(shù)據(jù)源多樣性和變化重構(gòu)。
數(shù)據(jù)源改造而服務(wù)平臺(tái)不需要大面積重構(gòu)。
NoSQL,指的是非關(guān)系型的數(shù)據(jù)庫(kù)。隨著互聯(lián)網(wǎng)web2.0網(wǎng)站的興起,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)在應(yīng)付web2.0網(wǎng)站,特別是超大規(guī)模和高并發(fā)的
SNS類(lèi)型的web2.0純動(dòng)態(tài)網(wǎng)站已經(jīng)顯得力不從心,暴露了很多難以克服的問(wèn)題,而非關(guān)系型的數(shù)據(jù)庫(kù)則由于其本身的特點(diǎn)得到了非常迅速的發(fā)展。
NoSQL(NoSQL
= Not Only SQL
),意即“不僅僅是SQL”,是一項(xiàng)全新的數(shù)據(jù)庫(kù)革命性運(yùn)動(dòng),早期就有人提出,發(fā)展至2009年趨勢(shì)越發(fā)高漲。NoSQL的擁護(hù)者們提倡運(yùn)用非關(guān)系型的數(shù)
據(jù)存儲(chǔ),相對(duì)于鋪天蓋地的關(guān)系型數(shù)據(jù)庫(kù)運(yùn)用,這一概念無(wú)疑是一種全新的思維的注入。
從這一新興技術(shù)中選擇一款正確的NoSQL數(shù)據(jù)庫(kù)是非常具有挑戰(zhàn)性的。比一下網(wǎng)建議在選擇時(shí)考慮以下因素:
并發(fā)控制
并
發(fā)控制指的是當(dāng)多個(gè)用戶(hù)同時(shí)更新運(yùn)行時(shí),用于保護(hù)數(shù)據(jù)庫(kù)完整性的各種技術(shù)。并發(fā)機(jī)制不正確可能導(dǎo)致臟讀、幻讀和不可重復(fù)讀等此類(lèi)問(wèn)題。并發(fā)控制的目的是保
證一個(gè)用戶(hù)的工作不會(huì)對(duì)另一個(gè)用戶(hù)的工作產(chǎn)生不合理的影響。在某些情況下,這些措施保證了當(dāng)用戶(hù)和其他用戶(hù)一起操作時(shí),所得的結(jié)果和她單獨(dú)操作時(shí)的結(jié)果是
一樣的。在另一些情況下,這表示用戶(hù)的工作按預(yù)定的方式受其他用戶(hù)的影響。
封鎖
就是事務(wù)T在對(duì)某個(gè)數(shù)據(jù)對(duì)象(例如表、記錄等)操作之前,先向系統(tǒng)發(fā)出請(qǐng)求,對(duì)其加鎖。加鎖后事務(wù)T就對(duì)該數(shù)據(jù)對(duì)象有了一定的控制,在事務(wù)T釋放它的鎖之前,其它的事務(wù)不能更新此數(shù)據(jù)對(duì)象。
封鎖是一次只允許一個(gè)用戶(hù)讀取或修改的一種機(jī)制,是實(shí)現(xiàn)并發(fā)控制的一個(gè)非常重要的技術(shù)。
MVCC
Multi-Version Concurrency Control多版本并發(fā)控制,維持一個(gè)數(shù)據(jù)的多個(gè)版本使讀寫(xiě)操作沒(méi)有沖突。MVCC優(yōu)化了數(shù)據(jù)庫(kù)并發(fā)系統(tǒng),使系統(tǒng)在有大量并發(fā)用戶(hù)時(shí)得到最高的性能,并且可以不用關(guān)閉服務(wù)器就直接進(jìn)行熱備份。
ACID
指
數(shù)據(jù)庫(kù)事務(wù)正確執(zhí)行的四個(gè)基本要素的縮寫(xiě)。包含:原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久
性(Durability)。一個(gè)支持事務(wù)(Transaction)的數(shù)據(jù)庫(kù)系統(tǒng),必需要具有這四種特性,否則在事務(wù)過(guò)程(Transaction
processing)當(dāng)中無(wú)法保證數(shù)據(jù)的正確性,交易過(guò)程極可能達(dá)不到交易方的要求。
None
一些系統(tǒng)不提供原子性。
鏡像
數(shù)據(jù)庫(kù)鏡像是DBMS根據(jù)DBA的要求,自動(dòng)把整個(gè)數(shù)據(jù)庫(kù)或其中的關(guān)鍵數(shù)據(jù)復(fù)制到另一個(gè)磁盤(pán)上,每當(dāng)主數(shù)據(jù)庫(kù)更新時(shí),DBMS會(huì)自動(dòng)把更新后的數(shù)據(jù)復(fù)制過(guò)去,即DBMS自動(dòng)保證鏡像數(shù)據(jù)與主數(shù)據(jù)的一致性。
鏡像分為同步和異步。
數(shù)據(jù)存儲(chǔ)
指的是數(shù)據(jù)的物理特性怎樣被存儲(chǔ)在數(shù)據(jù)庫(kù)中。
磁盤(pán) 數(shù)據(jù)被存儲(chǔ)在硬盤(pán)驅(qū)動(dòng)器里;
GFS或谷歌文件系統(tǒng)是一個(gè)由谷歌開(kāi)發(fā)的專(zhuān)有的分布式文件系統(tǒng);
Hadoop是Apache軟件框架,免費(fèi)許可下支持?jǐn)?shù)據(jù)密集型分布式應(yīng)用程序;
RAM隨機(jī)存儲(chǔ)器;
插件 可以添加外部插件;
Amazon S3通過(guò)Web服務(wù)接口提供存儲(chǔ);
BDB:BDB
全稱(chēng)是 “Berkeley DB”,它是MySQL具有事務(wù)能力的表類(lèi)型,由Sleepycat
Software開(kāi)發(fā)。BDB表類(lèi)型提供了MySQL用戶(hù)長(zhǎng)久期盼的功能,即事務(wù)控制能力。在任何RDBMS中,事務(wù)控制能力都是一種極其重要和寶貴的功
能。事務(wù)控制能力使得我們能夠確保一組命令確實(shí)已經(jīng)全部執(zhí)行成功,或者確保當(dāng)任何一個(gè)命令出現(xiàn)錯(cuò)誤時(shí)所有命令的執(zhí)行結(jié)果均被退回。
實(shí)現(xiàn)語(yǔ)言
實(shí)現(xiàn)語(yǔ)言會(huì)影響數(shù)據(jù)庫(kù)的發(fā)展速度。典型的NoSQL數(shù)據(jù)庫(kù)是用低級(jí)語(yǔ)言如C / C + +編寫(xiě)的。另一方面,那些更高層次的語(yǔ)言如Java,使自定義更容易。
實(shí)現(xiàn)語(yǔ)言有:C, C++, Erlang, Java, Python
特性
考慮下列哪一個(gè)特點(diǎn)對(duì)你的數(shù)據(jù)庫(kù)是最重要的:
持久性
可用性
一致性
分區(qū)容忍性
證書(shū)類(lèi)型
下面這些許可證是一個(gè)不同的開(kāi)放源碼許可的形式:
GPL:通用公共許可證
BSD:伯克利軟件分發(fā)
MPL:Mozilla公共許可證
EPL:Eclipse公共許可證
IDPL:最初的開(kāi)發(fā)者的公共許可證
LGPL:較寬松通用公共許可證
存儲(chǔ)類(lèi)型
存儲(chǔ)類(lèi)型是NoSQL數(shù)據(jù)庫(kù)最大的不同,是決定使用哪款數(shù)據(jù)庫(kù)的一個(gè)首要指標(biāo)。
關(guān)鍵字:支持get、put和刪除操作
按列存儲(chǔ):相對(duì)于傳統(tǒng)的按行存儲(chǔ),數(shù)據(jù)集成容易多了
面向文件系統(tǒng):存儲(chǔ)像是JSON或XML這樣的結(jié)構(gòu)化文件,很容易就能從面向?qū)ο筌浖蝎@取數(shù)據(jù)。
NoSQL薄弱的安全性會(huì)給企業(yè)帶來(lái)負(fù)面影響 。Imperva公司創(chuàng)始人兼CTO Amichai Shulman如是說(shuō)。在新的一年中,無(wú)疑會(huì)有更多企業(yè)開(kāi)始或籌劃部署NoSQL。方案落實(shí)后就會(huì)逐漸發(fā)現(xiàn)種種安全問(wèn)題,因此早做準(zhǔn)備才是正確的選擇。 作為傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的替代方案,NoSQL在查詢(xún)中并不使用SQL語(yǔ)言,而且允許用戶(hù)隨時(shí)變更數(shù)據(jù)屬性。此類(lèi)數(shù)據(jù)庫(kù)以擴(kuò)展性良好著稱(chēng),并能夠在需要大量應(yīng)用程序與數(shù)據(jù)庫(kù)本身進(jìn)行實(shí)時(shí)交互的交易處理任務(wù)中發(fā)揮性能優(yōu)勢(shì),Couchbase創(chuàng)始人兼產(chǎn)品部門(mén)高級(jí)副總裁James Phillips解釋稱(chēng):NoSQL以交易業(yè)務(wù)為核心。它更注重實(shí)時(shí)處理能力并且擅長(zhǎng)直接對(duì)數(shù)據(jù)進(jìn)行操作,大幅度促進(jìn)了交互型軟件系統(tǒng)的發(fā)展。Phillips指出。其中最大的優(yōu)勢(shì)之一是能夠隨時(shí)改變(在屬性方面),由于結(jié)構(gòu)性的弱化,修改過(guò)程非常便捷。 NoSQL最大優(yōu)勢(shì)影響其安全性 NoSQL的關(guān)鍵性特色之一是其動(dòng)態(tài)的數(shù)據(jù)模型,Shulman解釋道。我可以在其運(yùn)作過(guò)程中加入新的屬性記錄。因此與這種結(jié)構(gòu)相匹配的安全模型必須具備一定的前瞻性規(guī)劃。也就是說(shuō),它必須能夠了解數(shù)據(jù)庫(kù)引入的新屬性將引發(fā)哪些改變,以及新加入的屬性擁有哪些權(quán)限。然而這個(gè)層面上的安全概念目前尚不存在,根本沒(méi)有這樣的解決方案。 根據(jù)Phillips的說(shuō)法,某些NoSQL開(kāi)發(fā)商已經(jīng)開(kāi)始著手研發(fā)安全機(jī)制,至少在嘗試保護(hù)數(shù)據(jù)的完整性。在關(guān)系型數(shù)據(jù)庫(kù)領(lǐng)域,如果我們的數(shù)據(jù)組成不正確,那么它將無(wú)法與結(jié)構(gòu)并行運(yùn)作,換言之?dāng)?shù)據(jù)插入操作整體將宣告失敗。目前各種驗(yàn)證規(guī)則與完整性檢查已經(jīng)比較完善,而事實(shí)證明這些驗(yàn)證機(jī)制都能在NoSQL中發(fā)揮作用。我們與其他人所推出的解決方案類(lèi)似,都會(huì)在插入一條新記錄或是文檔型規(guī)則時(shí)觸發(fā),并在執(zhí)行過(guò)程中確保插入數(shù)據(jù)的正確性。 Shulman預(yù)計(jì)新用戶(hù)很快將在配置方面捅出大婁子,這并非因?yàn)镮T工作人員的玩忽職守,實(shí)際上主要原因是NoSQL作為一項(xiàng)新技術(shù)導(dǎo)致大多數(shù)人對(duì)其缺乏足夠的知識(shí)基礎(chǔ)。Application Security研發(fā)部門(mén)TeamSHATTER的經(jīng)理Alex Rothacker對(duì)上述觀點(diǎn)表示贊同。他指出,培訓(xùn)的一大問(wèn)題在于,大多數(shù)NoSQL的從業(yè)者往往屬于新生代IT人士,他們對(duì)于技術(shù)了解較多,但往往缺乏足夠的安全管理經(jīng)驗(yàn)。 如果他們從傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)入手,那么由于強(qiáng)制性安全機(jī)制的完備,他們可以在使用中學(xué)習(xí)。但NoSQL,只有行家才能通過(guò)觀察得出正確結(jié)論,并在大量研究工作后找到一套完備的安全解決方案。因此可能有90%的從業(yè)者由于知識(shí)儲(chǔ)備、安全經(jīng)驗(yàn)或是工作時(shí)間的局限而無(wú)法做到這一點(diǎn)。 NoSQL需在安全性方面進(jìn)行優(yōu)化 盡管Phillips認(rèn)同新技術(shù)與舊經(jīng)驗(yàn)之間存在差異,但企業(yè)在推廣NoSQL時(shí)加大對(duì)安全性的關(guān)注會(huì)起到很大程度的積極作用。他認(rèn)為此類(lèi)數(shù)據(jù)存儲(chǔ)機(jī)制與傳統(tǒng)關(guān)系類(lèi)數(shù)據(jù)庫(kù)相比,其中包含著的敏感類(lèi)信息更少,而且與企業(yè)網(wǎng)絡(luò)內(nèi)部其它應(yīng)用程序的接觸機(jī)會(huì)也小得多。 他們并不把這項(xiàng)新技術(shù)完全當(dāng)成數(shù)據(jù)庫(kù)使用,正如我們?cè)谑占泶罅縼?lái)自其它應(yīng)用程序的業(yè)務(wù)類(lèi)數(shù)據(jù)時(shí),往往也會(huì)考慮將其作為企業(yè)數(shù)據(jù)存儲(chǔ)機(jī)制一樣,他補(bǔ)充道。當(dāng)然,如果我打算研發(fā)一套具備某種特定功能的社交網(wǎng)絡(luò)、社交游戲或是某種特殊web應(yīng)用程序,也很可能會(huì)將其部署于防火墻之下。這樣一來(lái)它不僅與應(yīng)用程序緊密結(jié)合,也不會(huì)被企業(yè)中的其它部門(mén)所觸及。 但Rothacker同時(shí)表示,這種過(guò)度依賴(lài)周邊安全機(jī)制的數(shù)據(jù)庫(kù)系統(tǒng)也存在著極其危險(xiǎn)的漏洞。一旦系統(tǒng)完全依附于周邊安全模型,那么驗(yàn)證機(jī)制就必須相對(duì)薄弱,而且缺乏多用戶(hù)管理及數(shù)據(jù)訪問(wèn)方面的安全保護(hù)。只要擁有高權(quán)限賬戶(hù),我們幾乎能訪問(wèn)存儲(chǔ)機(jī)制中的一切數(shù)據(jù)。舉例來(lái)說(shuō),Brian Sullivan就在去年的黑帽大會(huì)上演示了如何在完全不清楚數(shù)據(jù)具體內(nèi)容的情況下,將其信息羅列出來(lái)甚至導(dǎo)出。 而根據(jù)nCircle公司CTO Tim ‘TK’ Keanini的觀點(diǎn),即使是與有限的應(yīng)用程序相關(guān)聯(lián),NoSQL也很有可能被暴露在互聯(lián)網(wǎng)上。在缺少?lài)?yán)密網(wǎng)絡(luò)劃分的情況下,它可能成為攻擊者窺探存儲(chǔ)數(shù)據(jù)的薄弱環(huán)節(jié)。因?yàn)镹oSQL在設(shè)計(jì)上主要用于互聯(lián)網(wǎng)規(guī)模的部署,所以它很可能被直接連接到互聯(lián)網(wǎng)中,進(jìn)而面臨大量攻擊行為。 其中發(fā)生機(jī)率最高的攻擊行為就是注入式攻擊,這也是一直以來(lái)肆虐于關(guān)系類(lèi)數(shù)據(jù)庫(kù)領(lǐng)域的頭號(hào)公敵。盡管NoSQL沒(méi)有將SQL作為查詢(xún)語(yǔ)言,也并不代表它能夠免受注入式攻擊的威脅。雖然不少人宣稱(chēng)SQL注入在NoSQL這邊不起作用,但其中的原理是完全一致的。攻擊者需要做的只是改變自己注入內(nèi)容的語(yǔ)法形式,Rothacker解釋稱(chēng)。也就是說(shuō)雖然SQL注入不會(huì)出現(xiàn),但JavaScript注入或者JSON注入同樣能威脅安全。 此外,攻擊者在籌劃對(duì)這類(lèi)數(shù)據(jù)庫(kù)展開(kāi)侵襲時(shí),也很可能進(jìn)一步優(yōu)化自己的工具。不成熟的安全技術(shù)往往帶來(lái)這樣的窘境:需要花費(fèi)大量時(shí)間學(xué)習(xí)如何保障其安全,但幾乎每個(gè)IT人士都能迅速掌握攻擊活動(dòng)的組織方法。因此我認(rèn)為攻擊者將會(huì)始終走在安全部署的前面,Shulman說(shuō)道。遺憾的是搞破壞總比防范工作更容易,而我們已經(jīng)看到不少NoSQL技術(shù)方面的公開(kāi)漏洞,尤其是目前引起熱議的、以JSON注入為載體的攻擊方式。 NoSQL安全性并非其阻礙 然而,這一切都不應(yīng)該成為企業(yè)使用NoSQL的阻礙,他總結(jié)道。我認(rèn)為歸根結(jié)底,這應(yīng)該算是企業(yè)的一種商業(yè)決策。只要這種選擇能夠帶來(lái)吸引力巨大的商業(yè)機(jī)遇,就要承擔(dān)一定風(fēng)險(xiǎn),Shulman解釋道。但應(yīng)該采取一定措施以盡量弱化這種風(fēng)險(xiǎn)。 舉例來(lái)說(shuō),鑒于數(shù)據(jù)庫(kù)對(duì)外部安全機(jī)制的依賴(lài)性,Rothacker建議企業(yè)積極考慮引入加密方案。他警告稱(chēng),企業(yè)必須對(duì)與NoSQL相對(duì)接的應(yīng)用程序代碼仔細(xì)檢查。換言之,企業(yè)必須嚴(yán)格挑選負(fù)責(zé)此類(lèi)項(xiàng)目部署的人選,確保將最好的人才用于這方面事務(wù),Shulman表示。當(dāng)大家以NoSQL為基礎(chǔ)編寫(xiě)應(yīng)用程序時(shí),必須啟用有經(jīng)驗(yàn)的編程人員,因?yàn)榭蛻?hù)端軟件是抵擋安全問(wèn)題的第一道屏障。切實(shí)為額外緩沖區(qū)的部署留出時(shí)間與預(yù)算,這能夠讓員工有閑暇反思自己的工作內(nèi)容并盡量多顧及安全考量多想一點(diǎn)就是進(jìn)步。綜上所述,這可能與部署傳統(tǒng)的關(guān)系類(lèi)數(shù)據(jù)庫(kù)也沒(méi)什么不同。 具有諷刺意味的是,近年來(lái)數(shù)據(jù)庫(kù)應(yīng)用程序在安全性方面的提升基本都跟數(shù)據(jù)庫(kù)本身沒(méi)什么關(guān)系,nCircle公司安全研究及開(kāi)發(fā)部門(mén)總監(jiān)Oliver Lavery如是說(shuō)。
本文題目:nosql交易,什么是noSQL數(shù)據(jù)庫(kù)
標(biāo)題路徑:http://sd-ha.com/article42/dsspihc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開(kāi)發(fā)、網(wǎng)站內(nèi)鏈、域名注冊(cè)、定制開(kāi)發(fā)、建站公司、微信公眾號(hào)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容