《數據蔣堂》

數據蔣堂》的作者蔣步星,從事信息系統建設和數據處理長達20多年的時間。他豐富的工程經驗與深厚的理論功底相互融合、創新思想與傳統觀念的相互碰撞,虛擬與現實的相互交織,產生出了一篇篇的瀝血之作。此連載的內容涉及從數據呈現、采集到加工計算再到存儲以及挖掘等各個方面。大可觀數據世界之遠景、小可看技術疑難之細節。針對數據領域一些技術難點,站在研發人員的角度從淺入深,進行全方位、360度無死角深度剖析;對于一些業內觀點,站在技術人員角度闡述自己的思考和理解。蔣步星還會對大數據的發展,站在業內專家角度給予預測和推斷。靜下心來認真研讀你會發現,《數據蔣堂》的文章,有的會讓用戶避免重復前人走過的彎路,有的會讓攻城獅面對扎心的難題茅塞頓開,有的會為初入行業的讀者提供一把開啟數據世界的鑰匙,有的甚至會讓業內專家大跌眼鏡,產生思想交鋒。

聯合發布平臺

數據講堂 - 文章列表

多維分析預匯總的方案探討

多維分析預匯總的方案探討

發布時間:2019-03-07 Tag:,,

我們在《多維分析預匯總的存儲容量》中計算過,如果想做到O(1)的復雜度,至少要考慮界面用到的各種維度組合,這在 […]

多維分析預匯總的功能盲區

多維分析預匯總的功能盲區

發布時間:2019-02-28

在進一步討論如何在有限空間內實現多維分析的預匯總之前,我們有必要再了解一下預匯總方案還有什么功能上的不足,也就 […]

多維分析預匯總的存儲容量

多維分析預匯總的存儲容量

發布時間:2019-02-26 Tag:,,,

多維分析一般是交互式操作的,也就要求有極高的響應速度,而多維分析涉及的數據量常常很大,幾千萬上億行甚至更大都有 […]

數據庫的封閉性

數據庫的封閉性

發布時間:2019-02-20 Tag:,,

我們知道,數據庫的數據處理能力是封閉的。所謂封閉性,這里是指要被數據庫計算和處理的數據,必須事先裝入數據庫之內 […]

怎樣讓國產芯片性能超越Intel

怎樣讓國產芯片性能超越Intel

發布時間:2019-02-20 Tag:,,

做一次標題黨,其實我們做軟件的當然沒辦法改變芯片的性能,也不可能真地讓國產芯片超越Intel。 這個話題從去年 […]

中國報表漫談

中國報表漫談

發布時間:2018-12-11 Tag:,,

按:在敏捷BI橫行的年代,報表這個概念也有了更大的外延,很多用戶甚至技術人員都會將由復雜格式報表與BI系統中拖 […]

內存數據集產生的隱性成本

內存數據集產生的隱性成本

發布時間:2018-12-04 Tag:,

當我們要對數據做一些非常規的復雜運算時,通常要將數據裝入內存?,F在也有不少程序設計語言提供了內存數據集對象及基 […]

應對報表沒完沒了的五個步驟

應對報表沒完沒了的五個步驟

發布時間:2018-11-27 Tag:,,,,

報表的業務穩定性天生很差,業務開展過程中會催生出許多新的查詢統計需求,這就造成了沒完沒了的報表,這是個無法被消 […]

“后半”有序的分組

“后半”有序的分組

發布時間:2018-11-20 Tag:,,

上一期我們說了前半有序的數據,這次我們來看看“后半”有序的情況。 回顧一下前半有序的說法:我們要把數據集T按字 […]

前半有序的大數據排序

前半有序的大數據排序

發布時間:2018-11-13 Tag:,,

最近碰到這么一個案例,情況可以簡化總結成這樣:數據庫中有表T,其中有兩個重要的字段a和b,a是一個時間戳,精確 […]

如何將數據熱導出到文件

如何將數據熱導出到文件

發布時間:2018-11-06 Tag:,

隨著時間推移,數據庫中數據量會越來越大,如果把查詢分析都掛到數據庫上,有可能會影響到生產系統的正常運行。所以, […]

時序數據從分表到分庫

時序數據從分表到分庫

發布時間:2018-10-30 Tag:,,,,

這里的時序數據泛指一切隨時間推移而不斷增長的數據,比如通話記錄、銀行交易記錄等。 對于數據庫來講,時序數據并沒 […]

BI系統的前置計算

BI系統的前置計算

發布時間:2018-10-23 Tag:,

某機構上了一套分布式數據倉庫,歷史數據逐步裝進了倉庫,然后,基于數據倉庫構建了BI系統(主要是多維分析)。剛開 […]

性能優化是個手藝活

性能優化是個手藝活

發布時間:2018-10-18 Tag:,,

大數據的技術本質就是高性能,性能優化也是程序員們的永恒話題。 這里說的性能優化,主要是指在程序員的努力下能達到 […]

數據分布背后的邏輯

數據分布背后的邏輯

發布時間:2018-10-09 Tag:,,

在分布式數據庫及大數據平臺中,數據如何分布到多臺機器中是個很關鍵的問題。因為很多運算是數據密集型的,如果數據分 […]

為什么我們需要C程序員

為什么我們需要C程序員

發布時間:2018-08-28 Tag:,

再說一個招聘的話題。 大家可能知道,潤乾的軟件產品主體都是Java寫的,幾乎沒有別的語言。但是,我們在招聘算法 […]

從一道招聘考題談起

從一道招聘考題談起

發布時間:2018-08-28 Tag:,

潤乾研發部在招聘時有一個筆試題: 1/2,1/5,1/20,1/64,1/125都可以寫成有限小數,而1/3, […]

報表工具的SQL植入風險

報表工具的SQL植入風險

發布時間:2018-08-14 Tag:,

所有的報表工具都會提供參數功能,主要都是用于根據用戶輸入的查詢條件來選取合適的數據。比如希望查詢指定時間段的數 […]

內置的數據無法實現高性能

內置的數據無法實現高性能

發布時間:2018-08-07 Tag:

這里說的“內”, 是指數據庫之內。 當數據量變大時,我們常常會感到數據庫的性能下降明顯,但是,無論怎樣優化SQ […]

怎樣生成有關聯的測試數據

怎樣生成有關聯的測試數據

發布時間:2018-07-24 Tag:,,,,

在向用戶推薦新的數據處理技術,特別是涉及性能優化的場景時,經常會碰到生成測試數據的需求。畢竟,新方案要經過驗證 […]

遍歷復用

遍歷復用

發布時間:2018-07-17 Tag:

減少外存(硬盤)訪問量一直是提高大數據計算性能的永恒話題,我們也討論過列存、壓縮等直接減少訪問量甚至存儲量的手 […]

一些數據壓縮手段

一些數據壓縮手段

發布時間:2018-07-10 Tag:,,

我們知道,外存(硬盤)的性能遠遠低于內存,即使是同樣復雜度的運算(CPU計算量相同),如果能減少外存的訪問量, […]

用HBase做高性能鍵值查詢?

用HBase做高性能鍵值查詢?

發布時間:2018-07-03 Tag:,

最近碰到幾家用戶在使用HBase或者試圖使用HBase來做高性能查詢,場景也比較類似,就是從幾十億甚至上百億記 […]

BI系統中容易被忽視的數據源功能

BI系統中容易被忽視的數據源功能

用戶在選購BI解決方案的時候,常常會更關注界面環節的功能指標,比如美觀性、操作的流暢性、移動端支持等等。畢竟, […]

這個產品能支持多大數據量?

這個產品能支持多大數據量?

發布時間:2018-06-05 Tag:,,,

經常有用戶會問這個問題,你家的產品能處理多大數據量?似乎是這個值越大產品就越牛。 這個問題,其實沒多大意義。 […]

最簡單的大數據性能估算方法

最簡單的大數據性能估算方法

發布時間:2018-06-05 Tag:,,,

大數據的性能是個永恒的話題。不過,在實際工作中我們發現,許多人都不知道如何進行最簡單的性能估算,結果經常被大數 […]

大清單報表的打???

大清單報表的打???

發布時間:2018-05-29 Tag:,,,

我們談了大清單報表的呈現方法,其實有時候這些報表還需要打印,比如銀行打印流水對賬單。 那么,打印是不是也要像呈 […]

大清單報表應當怎么做?

大清單報表應當怎么做?

發布時間:2018-05-29 Tag:,,

在數據查詢時,有時會碰到數據量很大的清單報表。用戶輸入的查詢條件很寬泛,可能會從數據庫中查出幾百上千萬行甚至過 […]

大數據技術的4個E

大數據技術的4個E

發布時間:2018-05-15 Tag:

大數據的4個V說法在業界已經盡人皆知,這是指的大數據本身的特征?,F在我們來考察一下用于處理大數據的技術應該具有 […]

做基礎軟件很悲壯?

做基礎軟件很悲壯?

發布時間:2018-05-08 Tag:

這幾天中國數據庫界出了一件悲傷的事情,南大通用創始人崔維力先生突然因病去世。我和崔先生神交已久,但卻未曾謀面, […]

做基礎軟件要投入很多錢?

做基礎軟件要投入很多錢?

發布時間:2018-04-24 Tag:,,

現在有個說法,國家對基礎軟硬件的投入太少,經常會說微軟、Oracle、Intel這些巨頭每年的研發費有多少多少 […]

國產操作系統還能怎么做?

國產操作系統還能怎么做?

發布時間:2018-04-24 Tag:,

一家之言,開個腦洞。 操作系統在市場上的關鍵點,并不在于進程管理、文件系統這些看起來很核心的東西,這些東西真地 […]

國產數據庫通通都沒戲!

國產數據庫通通都沒戲!

發布時間:2018-04-24 Tag:,

這標題擺明了就是招人罵,一下子把國內做數據庫的同行們都得罪了,甚至連自己都沒落下(我也算做數據庫的,而且當然也 […]

人工智能中的“人工”

人工智能中的“人工”

發布時間:2018-04-17 Tag:,,

自從AlphaGo贏了之后,人工智能就變得非常熱門了。不過,大家在關注“智能”時,卻很少把注意力放在“人工”上 […]

存儲和計算技術的選擇

存儲和計算技術的選擇

發布時間:2018-04-10 Tag:,

前一陣子公司有個售前來溝通某個用戶的情況:數據量比較大,又涉及很多復雜的關聯計算,在數據庫中用SQL計算性能很 […]

區塊鏈技術的一些疑問

區塊鏈技術的一些疑問

發布時間:2018-04-03 Tag:

下面是我在學習了解區塊鏈技術過程中產生的疑問,思考問題的過程中也會讓自己對這項技術理解得更深刻。我不算初學者( […]

數據蔣堂新一年

數據蔣堂新一年

發布時間:2018-04-03 Tag:

時光匆匆,《數據蔣堂》已經走過一年。在這里,也庸俗地感謝一下讀者們的一路相伴! 老實說,這一年寫這玩意兒有點難 […]

【數據蔣堂】第48期:Hadoop中理論與工程的錯位

【數據蔣堂】第48期:Hadoop中理論與工程的錯位

發布時間:2018-03-27 Tag:,,

Hadoop是當前重要的大數據計算平臺,它試圖摒棄傳統數據庫的理念,重新構建一套新的大數據體系。但是,這并不是 […]

【數據蔣堂】第47期:Hadoop - 一把殺雞用的牛刀

【數據蔣堂】第47期:Hadoop – 一把殺雞用的牛刀

發布時間:2018-03-20 Tag:

Hadoop是個龐大的重型解決方案,它的設計目標本來就是大規模甚至超大規模的集群,面對的是上百甚至上千個節點, […]

【數據蔣堂】第46期:大數據集群該不該透明化?

【數據蔣堂】第46期:大數據集群該不該透明化?

這好像是個多余的問題,大部分大數據平臺都把集群透明化作為一個基本目標在努力實現。 所謂集群透明化,是指把一個多 […]

【數據蔣堂】第45期:大數據計算語法的SQL化

【數據蔣堂】第45期:大數據計算語法的SQL化

發布時間:2018-03-06 Tag:,,,

回歸SQL是當前大數據計算語法的一個發展傾向。在Hadoop體系中,現在已經很少有人會自己從頭來寫MapRed […]

【數據蔣堂】第44期:談談臨時性計算

【數據蔣堂】第44期:談談臨時性計算

發布時間:2018-02-27 Tag:,,,,,

臨時性計算,顧名思義,是指臨時發生的一些計算需求。這種計算在日常數據處理中很常見,我們舉一些例子: 應對業務部 […]

【數據蔣堂】第43期:報表開發的現狀

【數據蔣堂】第43期:報表開發的現狀

發布時間:2018-02-22 Tag:,,,,

報表開發,看起來只是數據呈現環節的事務,并不起眼,但仔細想想,它涉及的工作范圍卻非常廣。如果把查詢和交互分析也 […]

【數據蔣堂】第42期:RDB與NoSQL的訪問性能

【數據蔣堂】第42期:RDB與NoSQL的訪問性能

發布時間:2018-02-12 Tag:,,,,

我們繼續從軟件角度上看外存數據源的性能,來考察數據庫的性能特點,在這篇文章中,我們只關心數據的訪問性能,而不涉 […]

【數據蔣堂】第41期:文件的性能分析

【數據蔣堂】第41期:文件的性能分析

我們以前講過硬盤的性能特征,主要是針對硬件層面進行分析的,現在我們來考慮軟件層面的差異。 理論上講,軟件可以穿 […]

【數據蔣堂】第40期:倍增分段技術

【數據蔣堂】第40期:倍增分段技術

發布時間:2018-01-23 Tag:,

區塊分段方案能夠滿足我們設定的4個目標。不過,除了處理區塊標記的麻煩外,這個辦法對于列存也不是非常適合。 數據 […]

【數據蔣堂】第39期:數據分段討論

【數據蔣堂】第39期:數據分段討論

發布時間:2018-01-16 Tag:,,

現代計算機一般都有多CPU核,而日益廣泛應用的固態硬盤也有較強的并發能力,這些硬件資源都為并行計算提供了有力的 […]

【數據蔣堂】第38期:JOIN延伸 - 維度其它應用

【數據蔣堂】第38期:JOIN延伸 – 維度其它應用

發布時間:2018-01-09 Tag:,,,

明確維度定義后,還可以換一種更清晰的方式來審視數據庫的結構。 這是我們常見的E-R圖: E-R圖是個網狀結構, […]

【數據蔣堂】第37期:JOIN延伸 - 維度查詢語法

【數據蔣堂】第37期:JOIN延伸 – 維度查詢語法

發布時間:2018-01-03 Tag:,,

有了維度定義后,我們就可以來梳理前面講過的簡化JOIN語法了。 先定義字段維度: 維度字段的維度為其本身; 外 […]

【數據蔣堂】第36期:JOIN延伸:維度概念

【數據蔣堂】第36期:JOIN延伸:維度概念

發布時間:2017-12-25 Tag:,,

談到數據分析時常常會用到維度這個詞,針對數據立方體的鉆取、旋轉、切片等操作都是圍繞維度進行的,幾乎所有的數據分 […]

【數據蔣堂】第35期:JOIN提速 - 有序歸并

【數據蔣堂】第35期:JOIN提速 – 有序歸并

發布時間:2017-12-18 Tag:,,,,

我們再來看同維表和主子表的JOIN,這兩種情況的優化提速手段是一樣的。 設兩個關聯表的規模(記錄數)分別是N和 […]

【數據蔣堂】第34期:JOIN提速 - 外鍵指針的衍生

【數據蔣堂】第34期:JOIN提速 – 外鍵指針的衍生

發布時間:2017-12-12 Tag:,,,

我們繼續討論外鍵JOIN,并延用?上一篇?的例子。 當數據量大到無法全部放進內存時,前述的指針化方法就不再有效 […]

【數據蔣堂】第33期:JOIN提速 - 外鍵指針化

【數據蔣堂】第33期:JOIN提速 – 外鍵指針化

發布時間:2017-12-07 Tag:,,

我們再來看重新定義JOIN后如何能夠提高運算性能,先看外鍵式JOIN的情況。 設有兩個表: products商 […]

【數據蔣堂】第32期:JOIN簡化 - 意義總結

【數據蔣堂】第32期:JOIN簡化 – 意義總結

發布時間:2017-11-28 Tag:,,

蔣步星《JOIN運算的簡化與提速》系列技術文章。 【數據蔣堂】第29期:JOIN運算剖析 【數據蔣堂】第30期 […]

【數據蔣堂】第31期:JOIN簡化 - 維度對齊

【數據蔣堂】第31期:JOIN簡化 – 維度對齊

發布時間:2017-11-21 Tag:,,

蔣步星《JOIN運算的簡化與提速》系列技術文章。 【數據蔣堂】第29期:JOIN運算剖析 【數據蔣堂】第30期 […]

【數據蔣堂】第30期:JOIN簡化 - 消除關聯

【數據蔣堂】第30期:JOIN簡化 – 消除關聯

發布時間:2017-11-15 Tag:,,

近期,蔣步星在「天善智能」直播分享了《JOIN運算的簡化與提速》,視頻地址:https://edu.hello […]

【數據蔣堂】第29期:JOIN運算剖析

【數據蔣堂】第29期:JOIN運算剖析

發布時間:2017-11-07 Tag:,,

10月19日,蔣步星在「天善智能」直播分享了《JOIN運算的簡化與提速》,視頻地址:https://edu.h […]

【數據蔣堂】第28期:迭代聚合語法

【數據蔣堂】第28期:迭代聚合語法

發布時間:2017-10-30 Tag:,,,,

我們討論過的常規聚合運算如SUM/COUNT和非常規聚合運算如maxp/top,都是事先設計好的聚合函數。但如 […]

【數據蔣堂】第27期:非常規聚合

【數據蔣堂】第27期:非常規聚合

發布時間:2017-10-24 Tag:,

標準SQL中提供了五種最常用的聚合運算:SUM/COUNT/AVG/MIN/MAX。觀察這幾個運算,我們發現它 […]

【數據蔣堂】第26期:再談有序分組

【數據蔣堂】第26期:再談有序分組

發布時間:2017-10-12 Tag:,,

細心的讀者可能會發現,我們在討論有序分組時只研究了待分組集合的成員次序對分組運算可能的影響,但即然要考慮集合的 […]

【數據蔣堂】第25期:有序分組

【數據蔣堂】第25期:有序分組

發布時間:2017-10-10 Tag:,

我們知道,SQL延用了數學上的無序集合概念,所以SQL的分組并不關注過待分組集合中成員的次序。我們在前面討論過 […]

【數據蔣堂】第24期:非等值分組

【數據蔣堂】第24期:非等值分組

發布時間:2017-10-10 Tag:,

?前一期?【數據蔣堂】第23期:還原分組運算的本意 我們在上一期研究了分組運算的實質,即將一個集合按某種規則拆 […]

【數據蔣堂】第23期:還原分組運算的本意

【數據蔣堂】第23期:還原分組運算的本意

發布時間:2017-09-19 Tag:,,,

分組是SQL中常見的運算,但未必所有人都能深刻地理解它。 分組運算的實質是將一個集合按照某種規則拆分成若干個子 […]

【數據蔣堂】第22期:有序遍歷語法

【數據蔣堂】第22期:有序遍歷語法

發布時間:2017-09-19 Tag:,,

前一期?【數據蔣堂】第21期:常規遍歷語法 我們繼續討論遍歷運算的語法規則。 5. 序號的引用 SQL延用了數 […]

【數據蔣堂】第21期:常規遍歷語法

【數據蔣堂】第21期:常規遍歷語法

發布時間:2017-09-05 Tag:,,

遍歷可以說是最基本的集合運算了,比如求和、計數、尋找最大最小值等聚合運算,按條件過濾集合、根據集合成員生成另一 […]

【數據蔣堂】第20期:從SQL語法看離散性

【數據蔣堂】第20期:從SQL語法看離散性

發布時間:2017-08-21 Tag:,,,

所謂離散性,是指集合的成員可以游離在集合之外存在并參與運算,游離成員還可以再組成新的集合。從離散性的解釋上可以 […]

【數據蔣堂】第19期:從SQL語法看集合化

【數據蔣堂】第19期:從SQL語法看集合化

發布時間:2017-08-21 Tag:,,

SQL作為最常用的結構化數據計算語言,雖然在做一些細致處理時不太方便,但用于描述基本運算還是比Java等高級語 […]

【數據蔣堂】第18期:SQL用作大數據計算語法好嗎?

【數據蔣堂】第18期:SQL用作大數據計算語法好嗎?

發布時間:2017-08-08 Tag:,,

當前的大數據平臺在處理結構化數據時大都仍然以提供SQL語法為主流。兼容SQL的好處是很明顯的,SQL的應用非常 […]

【數據蔣堂】第17期:SQL的困難源于關系代數

【數據蔣堂】第17期:SQL的困難源于關系代數

發布時間:2017-07-31 Tag:,,

在結構化數據處理領域,SQL無疑是應用最廣泛的工作語言,不僅被所有關系數據庫采用,許多新進的大數據平臺也將實現 […]

【數據蔣堂】第16期:SQL像英語是個善意的錯誤

【數據蔣堂】第16期:SQL像英語是個善意的錯誤

發布時間:2017-07-25 Tag:,,

我們知道,SQL長得很像英語,簡單的SQL語句直接可以作為英語讀。除了SQL外,其它主要程序設計語言都沒有這樣 […]

【數據蔣堂】第15期:開放的計算能力為數據庫瘦身

【數據蔣堂】第15期:開放的計算能力為數據庫瘦身

發布時間:2017-07-18 Tag:,

【數據蔣堂】第14期:計算封閉性導致臃腫的數據庫 我們在上一期談到,數據庫的臃腫,也就是過多的中間表以及相關存 […]

【數據蔣堂】第14期:計算封閉性導致臃腫的數據庫

【數據蔣堂】第14期:計算封閉性導致臃腫的數據庫

發布時間:2017-07-10 Tag:,,

許多大型用戶的數據庫(倉庫)在運行多年之后,都會積累出很多的數據表,嚴重者數以萬計。這些數據表年代久遠,有些已 […]

【數據蔣堂】第13期:怎樣看待存儲過程的移植困難

【數據蔣堂】第13期:怎樣看待存儲過程的移植困難

發布時間:2017-07-04 Tag:,,

存儲過程移植困難是經常被詬病的,在羅列存儲過程的缺點時,這一條幾乎從來不會被遺漏。 存儲過程的移植確實很困難, […]

【數據蔣堂】第12期:存儲過程的利之弊

【數據蔣堂】第12期:存儲過程的利之弊

發布時間:2017-06-22 Tag:,

存儲過程是數據庫領域中應用非常廣泛的技術,關于它的利弊討論由來已久,我們這里針對存儲過程的兩個公認度較高的優點 […]

【數據蔣堂】第11期:不要對自助BI期望過高

【數據蔣堂】第11期:不要對自助BI期望過高

發布時間:2017-06-15 Tag:,,,

從早期的多維分析(OLAP)到近年來的敏捷BI,BI產品廠商一直在強調自助能力,宣稱可以由業務人員自己分析數據 […]

【數據蔣堂】第10期:報表的數據計算層

【數據蔣堂】第10期:報表的數據計算層

發布時間:2017-06-06 Tag:,,,

我們在上一期已經解釋了報表應用結構中數據計算層的必要性,以及可以使用報表工具自定義數據源接口來實現計算層。在計 […]

【數據蔣堂】第9期:報表應用的三層結構

【數據蔣堂】第9期:報表應用的三層結構

發布時間:2017-05-31 Tag:,

在傳統的報表應用結構中,報表工具一般都是與數據源直接連接,并沒有一個中間的數據計算層。確實,大部分情況下的報表 […]

【數據蔣堂】第8期:列式存儲的另一面

【數據蔣堂】第8期:列式存儲的另一面

發布時間:2017-05-26 Tag:,

列存是常見的數據存儲技術,在許多場景下也確實很有效,因而也被不少數據倉庫類產品采用,在業內列存也常常就意味著高 […]

【數據蔣堂】第7期:硬盤的性能特征

【數據蔣堂】第7期:硬盤的性能特征

發布時間:2017-05-19 Tag:,

我們都知道內存比硬盤要快得多,大概能快出一兩個數量級(價格也要貴這么多)。不過,硬盤的問題并不只是訪問速度慢。 […]

【數據蔣堂】第6期:我們需要怎樣的OLAP?

【數據蔣堂】第6期:我們需要怎樣的OLAP?

發布時間:2017-05-12 Tag:,,

被狹義化的OLAP OLAP是商業智能應用中重要的組成部分,這個詞從字面上理解是在線分析的意思,也就是由用戶, […]

【數據蔣堂】第5期:1T數據到底有多大?

【數據蔣堂】第5期:1T數據到底有多大?

發布時間:2017-05-03 Tag:,

一英里不是個很長的距離,一立方英里相對于地球也不會讓人覺得是個很大的空間。然后我說,這個空間內能裝下全世界所有 […]

【數據蔣堂】第4期:索引的本質是排序

【數據蔣堂】第4期:索引的本質是排序

發布時間:2017-04-28 Tag:,

索引是經常用到的技術,但有些程序員對索引的原理了解不深,發現數據查詢性能有問題立刻就想起建索引,但效果常常也不 […]

【數據蔣堂】第3期:功夫都在報表外-漫談報表性能優化

【數據蔣堂】第3期:功夫都在報表外-漫談報表性能優化

發布時間:2017-04-20 Tag:,

應用系統中的報表,作為面向業務用戶的窗口,其性能一直被高度關注。用戶輸入參數后都希望立即就能看到統計查詢結果, […]

【數據蔣堂】第2期:非結構化數據分析技術是忽悠

【數據蔣堂】第2期:非結構化數據分析技術是忽悠

發布時間:2017-04-12 Tag:,,

大數據概念興起的同時也帶熱了非結構化數據分析。傳說一個企業中80%的數據都是非結構化數據,如果按占據空間來算, […]

【數據蔣堂】第1期:多維分析的后臺性能優化手段

【數據蔣堂】第1期:多維分析的后臺性能優化手段

發布時間:2017-04-05 Tag:,,

多維分析就是針對一個事先準備好的數據立方體實施旋轉、切片(切塊)、鉆取等交互操作的過程,經常也被直接稱為OLA […]

广西快乐十分