選單

Oracle 的成功無法複製,國產資料庫該如何突破?

中國資料庫發展的黃金期,開源開放才是最有效的手段。

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

網際網路的發展打破了資訊的隔閡,資料量的爆發催生了基礎性軟體資料庫的應用。從中國資料庫市場來看,其經歷了 Oracle、IBM Db2 等國外主流商業資料庫的蠶食,也在早期國產資料庫廠商的深耕下進行了自主研發的探索,並在 MySQL、PostgreSQL 等開源資料庫的引領下實現了一些自定義,而後科技網際網路企業發力資料庫也讓整個市場開啟了大規模的“去 IOE”行動,如今隨著擁抱開源開放的新勢力加持,新場景中資料庫的新玩法也逐漸被解鎖。不過,時代、應用、場景在不斷變更的過程中,這些傳統、網際網路、新興的資料庫實踐者們是如何一路披荊斬棘走到今天的?又是如何在追逐滿足於市場硬性要求的同時帶來創新的?

在 2021 長沙·中國 1024 程式設計師節大會上,我們開設了「十大資料庫掌門人對話:十問資料庫」環節,邀請到以 DM(達夢)、Kingbase、GBase、GoldenDB 為代表的經典資料庫門派,以 OceanBase、PolarDB、TDSQL、openGauss 為代表的網際網路門派,以 TiDB、TDengine 為代表的新興資料庫企業,相聚於長沙,從歷史看未來,聚焦於當下探討資料庫的最佳解法。

武漢達夢資料庫股份有限公司董事長馮裕才透過線上影片表示,“在從事資料庫 40 年間,一直堅持原始創新,掌握核心技術,做中國人的自己的資料庫。一路走來,我們的成功離不開無數程式設計師的共同努力,讓我們攜起手來,立足中國資料庫的市場需求,面向世界主戰場,打造中國世界級資料庫產品,助力科技強國。”

對話嘉賓如下:

陽振坤 OceanBase 資料庫創始人、首席科學家

李飛飛 阿里巴巴集團副總裁、阿里雲智慧資料庫事業部和達摩院資料庫與儲存實驗室負責人

李 綱 騰訊雲副總裁

杜 勝 人大金倉總裁

黃東旭 PingCAP 聯合創始人兼 CTO、TiDB 作者

趙 培 中興通訊副總裁

李國良 清華大學計算機系教授、副主任,openGauss 總架構師

趙 偉 南大通用高階副總裁

陶建輝 濤思資料創始人、CEO

馮 源 武漢達夢資料庫股份有限公司副總經理

主持人:

周傲英 華東師範大學副校長

Oracle 的成功無法複製,國產資料庫該如何突破?

以下為對話全文:

一問:國產資料庫歷史上的地位?

周傲英:

資料庫跌宕沉浮發展四十年,其在當下也是技術圈頗為火爆的熱點之一。今天我們邀請到十位資料庫掌門人共話資料庫的發展,從類別上來看,可將十大掌門人分為經典、流行、實用三大門派;從時間上來看,可將其分為 60 後、70 後、80 後。不同的門派、不同的時代頂尖代表人物將在今天的對話、交流的過程中碰撞出什麼樣的共識與火花,不妨讓我們從「國產資料庫在歷史上的定位如何?」為開端第一問,開啟屬於我們的資料庫時代探討。

杜勝:

我們成立於1999年,是國內第一家從事國產資料庫研發和銷售的企業,在國產資料庫商業化這條道路上,我們已前行了 20 多年。2001 年,中國加入 WTO(World Trade Organization,世界貿易組織),全球化為中國經濟的發展帶來了巨大的推動作用,但在資料庫領域,相對落後的國產資料庫基本無法與國外先進產品競爭。當時無論是產品,還是研發能力、管理能力,和國外資料庫都有很大差距,發展非常艱難。

到了 2009 年,我們參與了國家電網核心的電力排程系統的建設,這個專案是為了電網執行安全而採用了國產資料庫,也正是這次實踐機會,讓我們的資料庫產品真正地走進了企業的核心業務領域。透過這個專案錘鍊了我們的團隊和產品,從此走上商業化道路。

我個人認為整個國產資料庫的發展,「

前十年,是積累。近十年,是前進

」。未來,尤其是信創領域,將會迎來了巨大的市場機遇。

陶建輝:

說點真話,我認為我們失掉了很多機會,如果只是做跟隨者的角色,很難超越別人。回過頭來看資料庫發展,如武漢達夢其實在 20 年前新的資料庫中已經開始流行,但那時缺乏應用場景的支援。

現在隨著很多新場景的誕生,

我們不要做追隨者,而是成為領頭角色,我認為現在新的機會已到來,不過任何新場景的誕生並非是與老場景相互格鬥,但也需要格鬥,這值得新生力量來做。

黃東旭:

我很少談歷史,因為大家開始做資料庫的時候,我還沒有出生。我認為資料庫這款產品是跟著國家或者市場需求往前走,哪裡有最極端的需求,就有最不一樣的場景,其實才能打造出一個具有引領性的優秀成果。

我們現在處於一個創造歷史的最好階段,也可以於當下定義一個全新賽道,在多年後讓人在回顧全球資料庫發展史時發現,有很多產品是中國人創造出來的。無需妄自菲薄,我認為我們現在有這樣的能力、資源、社會需求、場景,我們正在創造歷史。

趙培:

自 2014 年進入資料庫行業,我也經歷了中國的通訊裝置從落後到領先的過程。從宏觀角度來看,中國資料庫的發展可能沒有四十年,但是在過去 20- 30 年間,中國資料庫的地位比較重要。

在 2010 年前,作為使用方、應用方的中國是全球重要資料庫廠家不容忽視的市場。2010 年後,隨著國家政策的扶持,以及自身需求的增加、移動網際網路的發展,使得國產資料庫行業崛起,而這也是所有從業人員共同努力的結果。我認為目前中國的資料庫在全球應該排在前 3500 名,但是和 NO。1 還有一定的差距。

二問:歷史上傳統主流資料庫何以成功?

周傲英:

國外的資料庫市場也是從諸侯紛爭以後形成的三足鼎立,那麼從 Oracle、MySQL、IBM Db2 等已成功的主流資料庫來看,它們為什麼會成功?我們能否複製他們的成功?

陽振坤:

全球市場中最主流的資料庫分別是 Oracle、SQL Server、Db2 三大商業資料庫和 MySQL、PostgreSQL 兩種開源資料庫。其中,前三種商業資料庫都有很鮮明的特徵,它們都是隨著資料庫萌芽發展期共同成長起來的,也屬於大浪淘沙淘出來的。後兩種資料庫主要創造了一種新的模式——開源。

如果談及以後資料庫如何成功,我認為

業務催生創新。

李國良:

回顧資料庫的歷史,最開始獲得成功的是 Db2,主要歸因於其軟硬體結合、穩定性做得非常好。但是後來因為軟硬結合帶來的高昂成本讓不少企業無法負擔。此時,Oracle 抓住了小型機市場,掌握企業核心需求所在,由此逐步一統天下。SQL Server 最大的特點是應用,且它依託於 Windows 上,近日看,SQL Server 馬上要超過 Oracle 了,主要是因為其擁抱雲的轉型。

對於開源的 MySQL 和 PostgreSQL,其更是抓住了小眾化的場景。隨著網際網路的發展,當一些企業發現傳統資料庫無法解決自身的問題時,他們也會開始基於 MySQL、PostgreSQL 開源資料庫開發分散式資料庫等,這也是當下很多企業的做法。

我認為資料庫的發展是與國情的發展相同步,我國在資料庫領域做了大量的貢獻,也得到了很大的發展,未來也是大有可為的年代,我相信大家一起在技術上儘量去超越。

馮源:

Oracle 的成功某種程度上是不可複製的,因為它有時代因素包含其中。

不管是甲骨文也好,DB2 也好,我覺得成功的理由都是千篇一律的,不妨去探尋一下那些曾成功而後失敗資料庫廠商的問題所在,也為這才是千百不同之處。

以 Infomix 為例,當時該款產品釋出出來的時候非常流行,甚至份額最高達到過全球第四的位置,但最終卻以失敗告終了。其中原因或許有很多,但站在財務角度回過頭看,其採用的是經銷商模式,很多產品是賣給了分銷商,但分銷商並沒有把 Infomix 資料庫賣到終端使用者的手裡,即並沒有把觸角真正伸到自己使用者手中,導致失去了敏感性,也錯失了科技發展方向。

其實對我們而言,更有借鑑意義的並非是 Db2、Oracle 如何成功,而是看一些曾經輝煌後卻被時代淘汰的企業是如何失敗的,他們是否足夠敏感?是否保護好了自己的知識產品。

三問

:作為資料庫掌門人,最大的感觸?

周傲英

:資料庫掌門人最大感慨是什麼?

趙偉:

從業幾十年到現在,我想用一句話來形容資料庫多年的變化——“

昔日王謝堂前燕,飛入尋常百姓家

”。

企業級資料庫軟體在上世紀 80 年代問世時相當於資訊系統中的奢侈品,彼時巴統等西方國家封鎖社會主義國家的聯盟不允許向中國出口企業級資料庫等高新技術,因此國內金融等行業首先要確保能用上資料庫,無法考慮支援國產資料庫產業發展。

中國資料庫產業發展起來是隨著改革開放之後國家整體資訊化發展之勢,社會各層面的資訊化從政務,企業,網際網路,移動APP後端都有資料庫支撐。現在國家提倡高水平科技自強自立,金融、電信等資訊化高階行業已經開始規模化應用國產資料庫。

因此資料庫發展最大的變化一是資料庫應用已經非常普遍;二是中國市場內,正在真正實現中國資料庫產品在包括金融,電信等行業都可以真正進去。至於能夠佔領各行各業多少份額,就看企業本身的能力,是否真正能持續提供高質量產品給客戶創造價值。

李飛飛:

我想用四字來總結感慨:

風起雲湧。

這四個字有一語雙關之意。

為什麼這麼說?風起雲湧在古代文化中形容勢態有變化。我覺得在這個時代用風起雲湧來描述資料庫是最為準確的。資料庫處於鉅變的時代,正因為有了這些變化,才給了後來中國資料庫市場機會。

為什麼說一語雙關?我認為變化本身有一個新的事物就是雲計算。這個賽道為什麼變化,就像當年的恐龍之所以滅亡,如果不是因為環境變化,讓它們自己滅亡絕不可能。正是因為環境發生了鉅變,那麼恐龍積累的核心優勢反而變成了劣勢,新生事物才有可能產生出來。

雲的出現給了我們這些做資料庫超越傳統廠商的機會。

另外,我認為資料庫不僅僅是應用驅動,而是承上啟下的作用。資料庫剛好是中間系統,上面對接應用,下面管理硬體系統。除了應用發生變化,我覺得資料庫發展歷程是個閉環。早期資料庫被應用於國防軍用中,後來再到底下硬體層是大型機-小型機-行業應用-個人應用這樣的方向演進。網際網路時代,底層也是從大型機、小型機、單機、伺服器、雲邊端一體、雲的協同,上層是個人應用、商業應用,我覺得這是一個數據庫發展的脈搏。

這種新的底層設定變化相應給資料庫帶來了非常重要的變化。個人有個觀點雲的轉變趨勢不可阻擋,

技術架構+分散式雲的能力是當前核心趨勢

四問:當下中國市場需要什麼樣的資料庫?

周傲英:

數字經濟新時代,有幾大特點,第一資料是重要的生產要素;第二要發展數字技術;第三要建平臺,也是數字經濟基本特點。以上三大點凸顯了資料的重要性,數字技術要發展,那麼在中國市場上,資料背後的資料庫應該怎麼樣發展?我們需要什麼樣的資料庫?

陶建輝:

我分享一下當前我們正在做的東西。首先中國在做數字化轉型,

數字化轉型的本質是所有的東西都要智慧化,實際上也是物聯網化

,那麼由這些機器、感測器產生的大量資料應該怎麼處理。其實,在美國早就已經有家公司專門來處理這些資料,雖然中國也有實時資料庫公司,但這些實時資料庫公司沒有辦法應對如此大規模的資料。我認為這是一個機會,尤其是對 TDengine 這類創業而言,因為中國數字化轉型,大量的公司缺乏感測器和資料庫等技術應用,甚至在轉型早期都沒想過要將這些大量的資料儲存起來,現在很多企業有意識地想要儲存這些海量資料,這對我們有針對性的資料庫廠商而言就是機會。此外,我也認為資料庫一定要雲化。

李綱:

在資料庫發展歷史中,很長一段時間能夠看到,無論是商業資料庫,還是開源資料庫,對於終端使用者而言,使用起來仍有很大的門檻。包括近期騰訊資料庫在某股份制銀行上線以後,他們 CIO 直接說,“我們之前選你們有很大不安的,但是上線投產以後,發現還是很穩”。因此

時下市場中所需的資料庫首先有一點就是要打破並降低使用門檻。

第二塊是對於廣大從業者來說,很多 DBA 需要花費很多精力去掌握各種技能,對此,我們在做資料庫產品時也一直在致力於幫助 DBA 如何去將業務和應用更好地結合起來,幫助其瞭解更前沿的技術解決方案。

趙培:

中國市場需要什麼樣的資料庫?其實我認為資料庫只有有一個形態,就一定有它的應用場景,一定會是市場需要的。資料庫所包含的方向太多,選擇什麼樣的方向其實也看市場價值、國家需要、行業需求,找重點方向去做,這是比較重要的。

此外,未來資料庫不管是否雲化,只不過是一個部署形態、架構形態的問題,我認為國內資料庫在底層技術能力的掌握和提升方面和了解硬體變革對資料庫的影響,這兩個方向是非常關鍵的。

五問:中國資料庫的“替代工程”路在何方?

周傲英:

中國資料庫替代之路在何方?我們不單單要替代,而且要實現轉型升級,追隨大勢,替代過程中創新要如何實現?

陽振坤:

我在支付寶、淘寶都曾待過,經歷了 IOE 替代過程。2010 年,我們開始做 OceanBase 時,我曾被團隊內外的人員問過,為什麼不能用開源來做?

我認為,如果我們只是想到做替代也永遠只能是個追隨者。以前的資料庫應用場景是一個酒店、商店,現在要轉到為整個淘寶、支付寶,乃至為整個網際網路服務時,其實需求已經發生了很大變化。我們在這裡面能夠有機會做出遠遠超過以前的資料庫的能力,給使用者提供更好的服務。

馮源:

站在大家的角度來看,我們是一直在做替代。“工程”二字所包含的內容很多,我們更想從微觀層面基於替代工程將自己的產品、效能做好。

在多年的替代過程中,我認為最難的點在於生態。過往談及替代,這意味著我們是後來人,必須要在別人的影子下面活下來,這個影子也就是生態。此前別人高牆築壘,當你作為後來者衝進去以後,會發現所有的使用者、開發商對你的態度都是一樣,此時你哪怕連做一行程式碼遷移都非常困難,這個時候你不得不去考慮一些如何把生態營造起來的問題。

對此,我理解有兩類方式。一種是自己營造一個生態,但是這非常難。絕大多數還是希望能夠把現有的生態借用起來,如借用開源的生態,透過開源的模式良好地融入其中。另外一種是走相容路線,因為商業資料庫一般都是閉源的,我沒有辦法用開源方式來建,那我就只能用自己的方式去相容。

六問:國產資料庫的健康生態如何構建?

周傲英:

正如馮源老師所講的,替代首先要替代生態,那麼,中國國產資料庫的健康生態如何建設?

杜勝:

傳統的集中式資料庫廠商和網際網路企業做資料庫的思路其實有很大的不同。此前我們曾進行過統計,中國的集中式資料庫存量至少有 600 萬套,面對如此大規模的市場,如果要進行資料庫替換最為關鍵的因素是如何實現低成本的遷移,而不是採用重寫應用的高成本遷移路徑,這個成本太高,整個社會都難以承受。

分散式交易資料庫有價值,但是是在特定的細分領域,在更廣泛的市場上集中式關係資料庫依然擁有巨大的市場空間,這不是技術決定的,而是使用者需求和生態環境決定的。所以我認為,

集中式的關係資料庫依然是中國未來的正面戰場

,集中式資料庫已經能夠滿足絕大多數應用場景效能和穩定性的需求,而且應用開發商使用集中式資料庫的開發成本低、學習難度低、維護成本低,這是一個非常好的分工模型,應用開發商聚焦業務,資料庫廠商提供底層支撐。在全球市場來看,Oracle 所建立的這套體系在依然佔據主流,我們未來必將進入全球市場和 Oracle 正面競爭,不可能採用高成本路徑。

最後我認為目前我們所有的國產資料庫企業,並不具備在全球範圍構建一個全新生態的能力,繼承現有的生態可能是更快的路徑,先借力發展,等實力具備之後再去影響和發展自己的生態。

趙偉:

從更高角度去考慮生態的問題,比較快的捷徑肯定是採用開源資料庫和相容國外商用資料庫的生態。雖然資料庫有 SQL 國際標準,但現在資料庫實際行業標準是被 Oracle 所壟斷的,如 Oracle 的相容已成為各行業客戶測試的必選指標,但是如果我們完全沿用 Oracle 的標準,倘若有朝一日,在國際形勢緩和的情況下,我們的資料庫產業沒有國家政策的保護,那麼 Oracle 也很容易將資料庫市場佔去。

從長遠看,想在 10-20 年真正建設中國資料庫健康生態,還是必須要有中國自己的資料庫標準,包括構建中國智慧財產權專利聯盟,沉澱中國自己的資料庫智慧財產權。

黃東旭:

關於生態問題,我稍微補充一點,給大家講個小故事。

曾經諾基亞在頂峰時,看上去不可撼動,誰都沒有想到,一兩年之內 iPhone 完全淘汰了它。主要原因是我認為很多人忽略掉產品的指數效應,以自身為例,TiDB 第一個版本在 2017 年 11 月釋出,彼時其使用者量一隻手可以數得過來,但是現在顯然不是,這就需要我們不斷地去關注產品的指數效應。

另外,現在行業發生天翻地覆的變化,想要構建生態,開源是一種特別快的方式,雲則是做資料庫最好的機會。我曾反覆強調過或許下一代程式設計師不知道什麼是硬體了,有可能只知道雲提供的服務介面,因此所有基礎軟體開發者都要去擁抱雲,因為沒得選。

最後再做一點補充,有時候我們覺得自己做的資料庫非常高大上,總想著指導使用者去做一些東西,其實這不對,沒有什麼東西是完美的。

現在中國資料庫生態要構建得好,重點不是資料庫,而是應用

七問:資料庫的創新商業模式有哪些?

周傲英:

資料庫創新商業模式有哪些?雲模式亦或是開源模式?我認為資料庫是開源的發起者,如何體現在創新模式上?

李綱:

作為一款商業軟體,想要真正讓使用者甘心地購買,首先要在合作模式上進行創新。在這一方面,我們現在也正做聯創實驗室的模式,這種模式最重要一點是將應用結合到業務場景中。

整體來看,資料的創新商業模式可以從兩方面去完善,一種是與客戶共同進行定製開發,另一種與應用整合商聯合起來,共同將大家所需要的核心繫統打造成行業標杆,以此共享架構。

陽振坤:

我們得到了很多人鼓勵和支援,讓我們投入更大的人力、資源在開源和雲上,由此一直走下去。

八問:資料庫雲化後,何以解安全之憂?

周傲英:

上了雲以後,資料安不安全,何以解安全之憂?

李飛飛:

我們首先要打破“上雲不如放在自己手裡安全”的誤區。以前很多人說把錢放到家裡安全,放到人民銀行不安全,但過了多年以後,不少人發現存在銀行反而更安全,放在家裡可能被老鼠吃掉了。事實上,

雲提供了強大的安全防護能力。

從資料庫角度來看,我個人認為資料庫雲化不僅僅是雲化部署方式問題,更多是

從雲化角度去思考整個技術體系構建

,將雲作為一個底層基礎設施,由此結合一些如 TDE 等傳統安全能力,把雲資料庫能力提高到新的高度。與此同時,隨著一些新興計算技術的落地,雲資料庫也會更加安全。

其次,開源和閉源並沒有很大差異化。有人認為 Oracle 比開源資料庫領先,我並不贊同此觀點。我覺得開源或閉源只是一種選擇,不代表先進或不先進。

趙培:

我覺得資料庫安全七分靠管理三分靠技術。需要考慮公司的規章制度是否能杜絕很多安全風險,同時要有巨大的知識支撐。

九問:國產資料庫未來圖景?

周傲英:

未來國產資料庫的圖景是什麼?

馮源:

就國內而言,我認為現在是處於東風壓倒西風的局面下,但是未來我不認為這種趨勢會持續下去。另外,國內雖然有很多資料庫廠商,隨著時間的推移,資料庫廠商會從分散逐漸收斂。

陶建輝:

我比較看好資料庫在中國的發展,其中應用場景頗為重要。與國外相比,國內如製造業等領域都產生了較大的場景,這也是我們的優勢所在。

另外,我特別看好中國軟體工程師數量相當之高,因為資料庫是給軟體工程師用的。這麼多軟體工程師一定需要更好的工具,來解決中國本土海量場景,這也帶來了很多機會。

黃東旭:

現在我們處於新的時代,展開想,其實我們無須把自己與全球割裂開來看,為什麼資料庫的未來圖景只能是中國圖景,而不是全世界最好的資料庫公司。也許十幾年之後,我們所做的資料庫公司只是起點在中國,最終實現全球化,由中國人引領技術發展。

陽振坤:

其實資料庫本來就不分國界,Oracle 是美國的資料庫,但是已經被全世界在用了。以 OceanBase 資料庫為例,第一大使用者是支付寶,但是第三大使用者其實是國外的廠商,因此我們做的資料庫無須將自己侷限起來,要走出去。

十問:新資料庫時代,研發人才培養之道?

周傲英:

資料庫要發展,就必須有人會用它,更重要的是有人開發它,那麼從產學研教維度來看,如何有效將幾者結合起來?

李國良:

資料庫可以分為兩大類

,一種是傳統的事務型資料庫(TP)

,這種是為國家基礎建設而做,不可或缺。

第二種是百花齊放類,為創新而做

。基於以上兩種維度,這對資料庫的人才要求非常高。然而現在很多高校沒有達到 TP 這類資料庫所需的架構師水平的培養,且高校更注重的是教授學生如何用資料庫而非如何設計資料庫。我認為我們未來培養出來的頂尖架構師一定需要具備大局觀,不能侷限於某個知識點的學習,這是非常重要的一個方面。

另外,在學校很多時候會有侷限,缺乏與場景的互動,因此產學研應該更加密切地去結合,這是我們下一步應該去改進的方面。

趙培:

我認為高校老師和院士對自己太過嚴苛。為什麼這麼說?高校本身就具備綜合性,著重於學生能力的培養,而當學生進入企業之後,也會接受更加專業的培養。高校現在的學生其實擁有一定的基礎能力、基礎知識就可以了,當然我們也更希望看到未來高校有專業技術上突破。

其實,

中國大部分企業都屬於商業成功引領的技術成功

,在此,我們希望未來有更多的技術突破和創新築造成功的企業。

寄語

周傲英:

資料庫時代,我們應該如何抓住機遇?

馮源:

抓住客戶需求。

趙培:

聚焦客戶、聚焦需求、聚焦重點行業。

陶建輝:

利用中國場景和人才,走向全球。

黃東旭:

從開發者做起,從娃娃抓起,從教育開始。

陽振坤:

資料庫大有作為,歡迎眾多程式設計師加入。

周傲英:

資料庫是數字經濟最重要的基礎設施,資料才能賦能,開源開放才是做資料庫的最大手段。