gpu資料庫開源_開源精粹（二）！22個實用、有趣的開源項目

1. nvidia/cuda 公開源中的devel和runtime有什麼區別

從很多方面來看，CUDA和OpenCL的關系都和DirectX與OpenGL的關系很相像。如同DirectX和OpenGL一樣，CUDA和OpenCL中，前者是配備完整工具包、針對單一供應商(NVIDIA)的成熟的開發平台，後者是一個開放的標准。
雖然兩者抱著相同的目標：通用並行計算。但是CUDA僅僅能夠在NVIDIA的GPU硬體上運行，而OpenCL的目標是面向任何一種Massively Parallel Processor，期望能夠對不同種類的硬體給出一個相同的編程模型。由於這一根本區別，二者在很多方面都存在不同：

1）開發者友好程度。CUDA在這方面顯然受更多開發者青睞。原因在於其統一的開發套件(CUDA Toolkit, NVIDIA GPU Computing SDK以及NSight等等)、非常豐富的庫(cuFFT, cuBLAS, cuSPARSE, cuRAND, NPP, Thrust)以及NVCC(NVIDIA的CUDA編譯器)所具備的PTX(一種SSA中間表示，為不同的NVIDIA GPU設備提供一套統一的靜態ISA)代碼生成、離線編譯等更成熟的編譯器特性。相比之下，使用OpenCL進行開發，只有AMD對OpenCL的驅動相對成熟。

2）跨平台性和通用性。這一點上OpenCL佔有很大優勢（這也是很多National Laboratory使用OpenCL進行科學計算的最主要原因）。OpenCL支持包括ATI,NVIDIA,Intel,ARM在內的多類處理器，並能支持運行在CPU的並行代碼，同時還獨有Task-Parallel Execution Mode，能夠更好的支持Heterogeneous Computing。這一點是僅僅支持數據級並行並僅能在NVIDIA眾核處理器上運行的CUDA無法做到的。

3）市場佔有率。作為一個開放標准，缺少背後公司的推動，OpenCL顯然沒有占據通用並行計算的主流市場。NVIDIA則憑借CUDA在科學計算、生物、金融等領域的推廣牢牢把握著主流市場。再次想到OpenGL和DirectX的對比，不難發現公司推廣的高效和非盈利機構/標准委員會的低效(抑或謹慎，想想C++0x)。

很多開發者都認為，由於目前獨立顯卡市場的萎縮、新一代處理器架構(AMD的Graphics Core Next (GCN)、Intel的Sandy Bridge以及Ivy Bridge)以及新的SIMD編程模型(Intel的ISPC等)的出現，未來的通用並行計算市場會有很多不確定因素，CUDA和OpenCL都不是終點，我期待未來會有更好的並行編程模型的出現(當然也包括CUDA和OpenCL，如果它們能夠持續發展下去)。

2. VDPAU是怎麼與GPU交互的通過顯卡驅動，還是最大的問題就是怎麼調用GPU

X
Window系統下的開源庫(libvdpau)和
API實現顯示，我個人的理解是系統先有支持x11
的驅動然後顯卡的驅動也支持x
windows
，當軟體的動作需要到x
windows
的時候，通過x11驅動API介面就把數據發送到x
windows
，然後因為顯卡驅動支持所以GPU
可以根據X
windows
提供的開源庫進行解碼，然後通過x
windows
的api
介面輸出！

3. 什麽是GPU,NPU,ASIC

圖形處理器（英語：Graphics Processing Unit，縮寫：GPU），又稱顯示核心、視覺處理器、顯示晶元，是一種專門在個人電腦、工作站、游戲機和一些移動設備（如平板電腦、智能手機等）上圖像運算工作的微處理器。
嵌入式神經網路處理器（NPU）採用「數據驅動並行計算」的架構，特別擅長處理視頻、圖像類的海量多媒體數據。
ASIC被認為是一種為專門目的而設計的集成電路。是指應特定用戶要求和特定電子系統的需要而設計、製造的集成電路。

(3)gpu資料庫開源擴展閱讀：

GPU在幾個主要方面有別於DSP(Digital Signal Processing，簡稱DSP，數字信號處理)架構。其所有計算均使用浮點演算法，而且此刻還沒有位或整數運算指令。此外，由於GPU專為圖像處理設計，因此存儲系統實際上是一個二維的分段存儲空間，包括一個區段號（從中讀取圖像）和二維地址（圖像中的X、Y坐標）。此外，沒有任何間接寫指令。輸出寫地址由光柵處理器確定，而且不能由程序改變。這對於自然分布在存儲器之中的演算法而言是極大的挑戰。最後一點，不同碎片的處理過程間不允許通信。實際上，碎片處理器是一個SIMD數據並行執行單元，在所有碎片中獨立執行代碼。

4. 開源精粹（二）！22個實用、有趣的開源項目

作為一名開源愛好者，發掘優秀的開源項目是一件非常有趣的事情。在第一期中，我分享了單頁個人網站模板、組裝式 Flutter 應用框架、PHP 客戶端庫、Java 診斷工具等一些實用的庫和工具。本期依舊會為大家分享一些前端、後端、移動開發的相關工具，希望你能「淘」到適合自己的工具。

1.Vue-EasyTable

Vue-EasyTable 是一款基於 Vue2.x 的 table 組件，具備自適應、表頭與列固定、自定義單元格樣式、自定義 Loading 等功能。

2.React-Calendar

這是一款具備原生日期格式的日歷組件。它不依賴 Moment.js，支持日期選擇范圍，涵蓋了各國語言，開箱即用。

3.Matter

CSS 實現的 Material 組件合集項目，作者已將部分作品開源，效果可以在 CodePen 上查看。

4.Revery

Revery 是一款用於構建高性能、跨平台桌面應用的框架。它類似於加速版的原生 Electron，除了擁有類似 React / Rex 的庫，還具備 GPU 加速渲染功能，其內置的編譯器速度也相當快。

5.Web Accessibility Guide

這是一個精選了 Web 可訪問性貼士、技巧和最佳實踐的開源項目，你將會學習到一些改善 Web 可訪問性的實用做法。

1.SOFAJRaft

SOFAJRaft 是螞蟻金服開源的生產級 Java Raft 演算法庫，它基於 Raft 一致性演算法的生產級高性能 Java 實現，支持 MULTI-RAFT-GROUP，適用於高負載低延遲的場景，易於使用。

2. Dragonwell

阿里開源了 OpenJDK 發行版 Dragonwell，它提供長期支持，包括性能增強和安全修復。在數據中心大規模 Java 應用部署情況下，可以大幅度提高穩定性、效率以及性能。

3.Lawoole

Lawoole 是一款基於 Laravel 和 Swoole 的高性能 PHP 框架。它兼具了 Laravel 的特點，還解決了其功能背後的性能問題。同時，你還能感受到與 Laravel 一樣的編碼體驗。

4.AntNest

AntNest 是一個簡潔、快速的非同步爬蟲框架。它僅有 600 行代碼，基於 Python 3.6+.

5.PHP-Awesome

這個倉庫匯集了 PHP 優秀的資源，供你查詢和參考。

1.FlutterBoost

FlutterBoost 是閑魚開源的新一代 Flutter-Native 混合解決方案。它能夠幫你處理頁面的映射和跳轉，你只需要關心頁面的名字和參數即可。

2.MyLayout

MyLayout 是一套 iOS 界面視圖布局框架，可謂 iOS 下的界面布局利器。它集成了 iOS Autolayout、Size Classes、Android 的 5 大布局體系、HTML/CSS 的浮動定位技術以及 Flex-Box 和 Bootstrap 框架等主流的平台的界面布局功能，並提供了一套簡單、完備的多屏幕尺寸適配的解決方案。

3.SegementSlide

SegementSlide 是一個 iOS UI 庫，它具備完整的滑滾及切換組件，旨在解決多層 UIScrollView 嵌套滾動的問題。

1.DevHub

DevHub 是一款跨平台的 GitHub 通知管理客戶端，支持 Android、 iOS、網頁和桌面上使用，幫助你便捷的接收 GitHub 各類通知。

2.Reqman

Reqman 是一個幫助後端工程師進行 API 測試的工具，同時也是一個基於 Node.js 的爬蟲工具。

3.FreeCodeCamp

說到 FreeCodeCamp，或許大家不會陌生，而這個項目就是他們建立的開源課程和相應的代碼庫。網站提供了 6 大認證課程，也涉及了全棧開發認證。如果你感興趣，不妨了解下。

4.Gitter

Gitter 是 GitHub 小程序客戶端，作者採用 Taro 框架 + Taro UI 進行開發，而小程序內數據則來自 GitHub Api V3.

5.Awesome Podcasts

這個項目收集了各類實用的播客，涵蓋了主流的編程語言，希望對你提升技術水平有所幫助。

6.編程圖書大全

書籍不光能在你迷茫的時候，給予你答案，還能在你提升技能的時候，給予你幫助。這個倉庫收集了眾多編程圖書，涉及主流編程語言、人工智慧、演算法、Linux、大數據等。看看，有木有你需要的。

7.VS Code Netease Music

很多開發者喜歡邊寫代碼，邊聽音樂，VS Code Netease Music 這個插件就能滿足你在 VS Code 上聽歌的願望。它使用 Webview 實現，不依賴命令行播放器。

Star-Battle

Star-Battle 是一款使用 JavaScript ES6、Canvas 開發的飛船射擊類游戲。來 Enjoy 吧。

註：

如需轉載，煩請按下方註明出處信息，謝謝！

5. 鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座，鯤鵬攜手合作夥伴，已經全面進入各省市政務雲、金融核心交易系統、運營商三朵雲和電力調度等行業核心場景。鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座。

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座1

6月15日，在華為夥伴暨開發者大會2022上，華為公司副總裁、計算產品線總裁鄧泰華表示，華為始終堅持「硬體開放、軟體開源、使能夥伴、發展人才」的生態策略，與夥伴合作共贏、共建生態。

他透露，目前，鯤鵬、升騰夥伴已經超過4500家，推出超過12000個行業解決方案，鯤鵬、升騰開發者數量超過200萬，「智能基座」產教融合協同育人基地項目已經賦能了3000名教師，開設了1500門課程，覆蓋30多萬學生。

在硬體方面，鄧泰華指出，今年華為夥伴出貨佔比已經超過90%。在基礎軟體方面，歐拉首個數字基礎設施全場景版本今年3月已經發布；openGauss（開源高斯）資料庫3.0版本也已上線並支持多場景；同時，鯤鵬兩大開發套件實現升級，使能開發者高效原生開發。

鯤鵬攜手合作夥伴，已經全面進入各省市政務雲、金融核心交易系統、運營商三朵雲和電力調度等行業核心場景。鯤鵬行業技術生態滿足度穩步提升，今年預計達到75%，主流場景已經支持，軟體生態兼容性的瓶頸已經消除。

鄧泰華表示，歐拉開源兩年以來，產業共建成果顯著，發展超越預期。歐拉社區已經匯聚340多家全球企業，覆蓋晶元、部件、整機等產業鏈成員；吸引近萬名開源貢獻者，參與社區技術創新和版本開發；全球120多個國家、1500多個城市用戶累計下載量超過54萬次。

目前，整個歐拉系統的裝機量累計超過170萬套，新增市場份額達到19%，預計年底將達到25%，明年將做到中國新增市場份額第一。

本次大會上，麒麟軟體、統信軟體、麒麟信安、SUSE、普華基礎軟體、拓林思、中科創達（300496）、科東軟體、中科院軟體所9傢夥伴正式發布基於歐拉首個數字基礎設施全場景版本的操作系統商業發行版，將社區創新成果應用於千行百業。

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座2

在華為夥伴暨開發者大會2022上，華為公司副總裁、計算產品線總裁鄧泰華發表「共建計算產業，共創數智未來」主題演講，分享了鯤鵬、升騰、歐拉在商業、生態、技術方面的最新進展。本次大會，「中國算力網——智算網路」也正式上線。

據悉，鯤鵬、升騰夥伴目前已經超過4500家，推出超過12000個行業解決方案，鯤鵬、升騰開發者數量超過200萬，「智能基座」產教融合協同育人基地項目已經賦能了3000名教師，開設了1500門課程，覆蓋30多萬學生。

鯤鵬深耕行業數字化全面進入核心場景

鯤鵬持續升級基礎軟硬體平台，賦能夥伴和開發者，生態快速發展。在硬體方面，堅持夥伴優先，今年夥伴出貨佔比已經超過90%。在基礎軟體方面，歐拉首個數字基礎設施全場景版本openEuler 22.03 LTS於今年3月發布；openGauss資料庫3.0版本也已上線並支持多場景；同時，鯤鵬DevKit和鯤鵬BoostKit兩大套件升級，使能開發者高效原生開發。

9傢夥伴同期發布歐拉操作系統商業發行版

作為數字基礎設施的開源操作系統，歐拉持續豐富南向和北向的生態支持。歐拉南向支持多樣性設備，已經實現主流計算架構100%全覆蓋，包括ARM、x86、RISC-V等全部主流CPU指令集，同時支持NPU、GPU和DPU等多種異構算力。

歐拉北向使能IT、CT和OT全場景應用，與夥伴協作，適配一萬多款應用，主流應用場景100%支持。同時，通過共享分布式套件，進一步實現與鴻蒙互通，共同服務數字全場景。

歐拉開源兩年以來，產業共建成果顯著，發展超越預期。歐拉社區已經匯聚340多家全球企業，覆蓋晶元、部件、整機、OSV、ISV等產業鏈成員；吸引近萬名開源貢獻者，參與社區技術創新和版本開發；全球120多個國家、1500多個城市用戶累計下載量超過54萬次。

目前，整個歐拉系的裝機量累計超過170萬套，新增市場份額達到19%，預計年底將達到25%，明年將做到中國新增市場份額第一。

本次大會上，麒麟軟體、統信軟體、麒麟信安、SUSE、普華基礎軟體、拓林思、中科創達、科東軟體、中科院軟體所9傢夥伴正式發布基於openEuler22.03 LTS的操作系統商業發行版，將社區創新成果應用於千行百業。

升騰構建AI新生態加速行業智能升級

人工智慧加速行業落地，升騰AI發展恰逢其時。全國20多個城市規劃和建設人工智慧計算中心，其中，深圳、武漢、西安、成都、南京、杭州等多地的人工智慧計算中心已相繼上線，全部實現上線即飽和運營。AI算力，像水和電一樣，成為城市數字基礎設施公共資源，賦能數字經濟發展。

本次大會，「中國算力網——智算網路」正式上線。智算網路是「中國算力網」一期工程的核心板塊之一，標志著中國算力網計劃的全面展開，是中國算力網路建設邁出的關鍵一步。未來，各地智算中心、超算中心、「東數西算」樞紐節點等，都可以並入中國算力網，形成支撐數字經濟發展的統一算力大市場。

通過智算網路的建設，以東數西存、東數西算、東數西訓為牽引，將逐步形成綠色集約的算力布局；未來還將匯聚多種社會算力，形成更加泛在的算力協同，並通過全網的算力交易流通，彈性滿足全網范圍內的算力需求，從科研創新、應用孵化、產業匯聚、人才發展等多方面助力人工智慧產業高質量發展。

大模型全流程使能體系發布，共築中國大模型生態

當前AI正在走向領域大模型，發展大模型已成為產業界共識，智算網路也為其發展帶來新的機遇。為了更好地使能大模型發展，華為發布從規劃、開發到產業化的大模型全流程使能體系，與產業界共築中國大模型生態。該大模型全流程使能體系包括以下幾方面：

規劃升騰大模型沙盤，構築中國大模型創新高地。過去的一年，產業界基於升騰AI先後推出鵬程.盤古、鵬程.神農、紫東.太初、武漢.LuoJia、華為雲盤古系列等有影響力的大模型。今年，華為發布升騰科研創新使能計劃，鼓勵高校和科研機構開展大模型的研究與創新，在每個領域和行業打造出世界級領先的大模型。

打造大模型開發使能平台，讓大模型易開發、易適配、易部署。針對基礎模型開發，華為推出升思MindSpore和ModelArts結合的大模型開發套件，通過演算法開發、並行計算、存儲優化、斷點續訓，實現大模型的高效開發。

為快速適配行業應用，推出基於MindX的`大模型微調組件，實現一鍵式微調和低參數調優。在模型推理部署方面，推出基於MindStudio的大模型部署套件，實現分布式推理服務化、模型輕量化和動態加密部署。

從科研創新到行業落地，開創大模型產業化新模式。去年，全球首個智能遙感框架武漢.LuoJia和全球首個三模態大模型紫東.太初，成立了智能遙感開源生態聯盟和多模態人工智慧產業聯盟，已有60餘傢夥伴加入，陸續孵化出多個行業解決方案。今年，華為還將與夥伴一起，共同成立AI流體力學、AI生物醫葯、以及智慧育種等產業聯盟，助力相關領域的大模型創新和產業化發展。

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座3

2022年6月15日，在華為夥伴暨開發者大會2022上，華為公司副總裁、計算產品線總裁鄧泰華公布了歐拉、鯤鵬、升騰在商業、生態、技術方面的最新進展及帶來一系列最新發布：

中國算力網——智算網路正式上線；大模型全流程使能體系發布，共築中國大模型生態；從科研創新到行業落地，開創AI大模型產業化新模式；發布行業數智化轉型新架構，加速行業數字化轉型和智能升級。

值得注意的是，此次，麒麟軟體、統信軟體等9家華為合作夥伴也正式發布了歐拉操作系統商業發行版。

鄧泰華表示，截至目前，歐拉商業裝機量累計超過170萬套，新增市場份額達到19%，預計到今年底將達25%，明年的目標是做到中國新增市場份額第一。

據介紹，歐拉開源在金融、政府、交通等多個行業都得到了規模應用。

「市場的快速增長源於生態的繁榮。」鄧泰華稱，目前，歐拉社區已經融合全球340多家企業成員，覆蓋全產業鏈；吸引了近萬名開源貢獻者參與社區技術創新和版本開發；來自全球120多個國家/地區1500多個城市的用戶，累計下載量超過50萬次。

除了歐拉之外，目前華為鯤鵬、升騰夥伴已經超過4500家，推出超過12000個行業解決方案，鯤鵬、升騰開發者數量超過200萬。

歐拉、鯤鵬、升騰分別橫跨了華為面向B端的計算業務、企業業務、雲業務三大業務板塊。

華為內部人士向《證券日報》記者透露，三大生態一下步將持續融合擴容，加速向B端市場發力。

6. 創原會：保險行業精英齊聚，共論雲原生創新之道

1月15日，由創原會發起的「雲原生技術精英沙龍（保險行業專場）」成功舉辦，來自中國信通院、華為雲以及保險行業的技術精英，就「雲原生提速保險行業數字化轉型」以及「保險行業雲原生典型應用場景」進行了深入探討。

創原會是華為雲聯合CNCF、中國信通院及業界雲原生技術精英們，構建的全球化雲原生交流平台，旨在通過探索前沿雲原生技術、共享產業落地實踐，共創雲原生與業務融合的無限可能。

雲原生：保險行業數字化升級的必由之路

隨著百姓保險意識的增強、「互聯網+保險」對傳統業務的顛覆創新，保險行業正經歷一場產品、運營、業務模式全面升級的變革。

合眾人壽信息技術總監頊頌表示：「我們希望擴大外部交流，引入新的技術，並通過平台化戰略實現開放生態、跨界融合，進而與上下游渠道對接，建立一個整合了保險業務、數據、產品的體系，提高業務系統的靈活性和創新的敏捷性，實現以客戶為中心，數字化驅動、智慧經營的科技發展目標。」

中國信通院雲大所雲計算部副主任陳屹力，在會上分享了雲原生技術與保險業務融合的趨勢洞察。他認為：「 雲原生是保險行業新一輪數字化升級的必由之路， 其開放、敏捷、標準的特點，能快速幫助企業構建開放的平台，更好地支撐業務的快速發展和創新，實現降本增效。未來的1至3年，保險行業將迎來全面雲原生化的時代。」

雲原生基礎設施：為保險業務構建高效的雲原生底座

互聯網加持下的保險業務，呈現出交易頻次高、流量大等特點。同時，保險業務與不同行業的融合，也對業務敏捷創新提出了更高的要求。

華為雲雲原生解決方案資深架構師吉碩在會上介紹：「華為作為全球領先的ICT基礎設施和智能終端提供商，在自有業務升級、服務全球客戶的過程中，已實現超大規模企業雲原生實踐。我們將這些經驗與華為雲服務相結合，打造了更適合傳統行業客戶大規模落地雲原生的解決方案。」

華為雲基於擎天架構打造「以應用為中心」的雲原生基礎設施，為客戶構建全棧雲原生業務，提供了高效、敏捷的雲原生基礎設施平台。

通過提供x86、GPU、鯤鵬、升騰等多樣性算力，華為雲滿足保險行業核心交易、互聯網業務、AI及大數據業務對算力的差異化訴求，並基於擎天架構的軟硬協同能力，充分發揮出雲原生基礎設施性能，滿足業務大規模部署、大業務量並發的需求；同時，雲原生多雲平台幫助客戶快速構建多地多中心業務治理能力，實現跨地域的資源調度、業務擴容、流量治理；此外，標准、開放的應用管理平台，實現各類雲原生應用共平台部署，提升了業務的開發、運行、運維效率。

雲原生資料庫：保障保險業務數據的高效與安全

保險業務的快速發展，各企業資料庫數據量可高達幾十、數百TB，資料庫如何擴展、如何最大限度的發揮這些數據的業務價值，是困擾保險行業的難題。

華為雲資料庫聚焦全場景雲服務，推出了雲原生資料庫GaussDB，其基於統一的存算分離架構，兼容openGauss及主流開源資料庫生態，支持關系型與非關系型資料庫，並構建了多生態兼容、層次解耦、多副本強一致、數據融合、運算元下推等雲原生能力。GaussDB的極致性能解決了企業海量數據讀寫帶來的壓力。同時，數據跨AZ高可用、RPO=0、RTO秒級，滿足了保險行業監管的要求，且完整的工具鏈，可幫助企業快速完成數據的平滑遷移，確保業務數據0丟失。

目前，華為雲雲原生解決方案已廣泛應用在永安保險、眾惠保險等多家保險行業的標桿企業，幫助企業重塑雲原生業務架構，加速企業數字化升級。

聚八方領航者，論雲原生之道。未來，創原會成員將繼續與各行業的雲原生技術精英一起，持續賦能「新雲原生企業」，加速雲原生技術落地與產業繁榮。

視頻載入中...

7. 15 個開源的頂級人工智慧工具

斯坦福的專家在人工智慧報告中得出的結論："越來越強大的人工智慧應用，可能會對我們的社會和經濟產生深遠的積極影響，這將出現在從現在到2030年的時間段里。"

以下這些開源人工智慧應用都處於人工智慧研究的最前沿。

1.Caffe

它是由賈揚清在加州大學伯克利分校的讀博時創造的，Caffe是一個基於表達體系結構和可擴展代碼的深度學習框架。使它聲名鵲起的是它的速度，這讓它受到研究人員和企業用戶的歡迎。根據其網站所言，它可以在一天之內只用一個NVIDIA K40 GPU處理6000萬多個圖像。它是由伯克利視野和學習中心（BVLC）管理的，並且由NVIDIA和亞馬遜等公司資助來支持它的發展。

2. CNTK

它是計算機網路工具包（Computational Network Tookit）的縮寫，CNTK是一個微軟的開源人工智慧工具。不論是在單個CPU、單個GPU、多個GPU或是擁有多個GPU的多台機器上它都有優異的表現。微軟主要用它做語音識別的研究，但是它在機器翻譯、圖像識別、圖像字幕、文本處理、語言理解和語言建模方面都有著良好的應用。

3.Deeplearning4j

Deeplearning4j是一個java虛擬機（JVM）的開源深度學習庫。它運行在分布式環境並且集成在Hadoop和Apache Spark中。這使它可以配置深度神經網路，並且它與Java、Scala和其他JVM語言兼容。

4.DMTK

DMTK分布式集齊學習工具（Distributed Machine Learning Toolkit）的縮寫，和CNTK一樣，是微軟的開源人工智慧工具。作為設計用於大數據的應用程序，它的目標是更快的訓練人工智慧系統。它包括三個主要組件：DMTK框架、LightLDA主題模型演算法和分布式（多義）字嵌入演算法。為了證明它的速度，微軟聲稱在一個八集群的機器上，它能夠"用100萬個主題和1000萬個單詞的詞彙表（總共10萬億參數）訓練一個主題模型，在一個文檔中收集1000億個符號，"。這一成績是別的工具無法比擬的。

5.H20

相比起科研，H2O更注重將AI服務於企業用戶，因此H2O有著大量的公司客戶，比如第一資本金融公司、思科、Nielsen Catalina、PayPal和泛美都是它的用戶。它聲稱任何人都可以利用機器學習和預測分析的力量來解決業務難題。它可以用於預測建模、風險和欺詐分析、保險分析、廣告技術、醫療保健和客戶情報。

它有兩種開源版本：標准版H2O和Sparking Water版，它被集成在Apache Spark中。也有付費的企業用戶支持。

6.Mahout

它是Apache基金會項目，Mahout是一個開源機器學習框架。根據它的網站所言，它有著三個主要的特性：一個構建可擴展演算法的編程環境、像Spark和H2O一樣的預制演算法工具和一個叫Samsara的矢量數學實驗環境。使用Mahout的公司有Adobe、埃森哲咨詢公司、Foursquare、英特爾、領英、Twitter、雅虎和其他許多公司。其網站列了出第三方的專業支持。

7.MLlib

由於其速度，Apache Spark成為一個最流行的大數據處理工具。MLlib是Spark的可擴展機器學習庫。它集成了Hadoop並可以與NumPy和R進行交互操作。它包括了許多機器學習演算法如分類、回歸、決策樹、推薦、集群、主題建模、功能轉換、模型評價、ML管道架構、ML持久、生存分析、頻繁項集和序列模式挖掘、分布式線性代數和統計。

8.NuPIC

由Numenta公司管理的NuPIC是一個基於分層暫時記憶理論的開源人工智慧項目。從本質上講，HTM試圖創建一個計算機系統來模仿人類大腦皮層。他們的目標是創造一個"在許多認知任務上接近或者超越人類認知能力"的機器。

除了開源許可，Numenta還提供NuPic的商業許可協議，並且它還提供技術專利的許可證。

9.OpenNN

作為一個為開發者和科研人員設計的具有高級理解力的人工智慧，OpenNN是一個實現神經網路演算法的c++編程庫。它的關鍵特性包括深度的架構和快速的性能。其網站上可以查到豐富的文檔，包括一個解釋了神經網路的基本知識的入門教程

10.OpenCyc

由Cycorp公司開發的OpenCyc提供了對Cyc知識庫的訪問和常識推理引擎。它擁有超過239,000個條目，大約2,093,000個三元組和大約69,000 owl：這是一種類似於鏈接到外部語義庫的命名空間。它在富領域模型、語義數據集成、文本理解、特殊領域的專家系統和游戲 AI中有著良好的應用。該公司還提供另外兩個版本的Cyc：一個可免費的用於科研但是不開源，和一個提供給企業的但是需要付費。

11.Oryx 2

構建在Apache Spark和Kafka之上的Oryx 2是一個專門針對大規模機器學習的應用程序開發框架。它採用一個獨特的三層λ架構。開發者可以使用Orys 2創建新的應用程序，另外它還擁有一些預先構建的應用程序可以用於常見的大數據任務比如協同過濾、分類、回歸和聚類。大數據工具供應商Cloudera創造了最初的Oryx 1項目並且一直積極參與持續發展。

12.PredictionIO

今年的二月，Salesforce收購了PredictionIO，接著在七月，它將該平台和商標貢獻給Apache基金會，Apache基金會將其列為孵育計劃。所以當Salesforce利用PredictionIO技術來提升它的機器學習能力時，成效將會同步出現在開源版本中。它可以幫助用戶創建帶有機器學習功能的預測引擎，這可用於部署能夠實時動態查詢的Web服務。

13.SystemML

最初由IBM開發，SystemML現在是一個Apache大數據項目。它提供了一個高度可伸縮的平台，可以實現高等數學運算，並且它的演算法用R或一種類似python的語法寫成。企業已經在使用它來跟蹤汽車維修客戶服務、規劃機場交通和連接社會媒體數據與銀行客戶。它可以在Spark或Hadoop上運行。

14.TensorFlow

TensorFlow是一個谷歌的開源人工智慧工具。它提供了一個使用數據流圖進行數值計算的庫。它可以運行在多種不同的有著單或多CPU和GPU的系統，甚至可以在移動設備上運行。它擁有深厚的靈活性、真正的可移植性、自動微分功能，並且支持Python和c++。它的網站擁有十分詳細的教程列表來幫助開發者和研究人員沉浸於使用或擴展他的功能。

15.Torch

Torch將自己描述為："一個優先使用GPU的擁有機器學習演算法廣泛支持的科學計算框架"，它的特點是靈活性和速度。此外，它可以很容易的通過軟體包用於機器學習、計算機視覺、信號處理、並行處理、圖像、視頻、音頻和網路等方面。它依賴一個叫做LuaJIT的腳本語言，而LuaJIT是基於Lua的。

歡迎關注~

微信公眾號： IT百戰程序員 ，免費提供人工智慧、大數據、雲計算等資料～～不管你在地球哪個方位，歡迎你的關注！

8. 有哪些優秀的CUDA開源代碼

在已有工程上右鍵單擊，選擇添加已有項。
二.添加編譯規則。右鍵單擊工程文件，選擇自定義生成規則，在彈出的對話框中選擇CUDA Build Rule x.x。
三.修改.cu文件的編譯器。右鍵單擊.cu文件，單擊屬性，修改編譯規則，選擇剛才添加的CUDA編譯器。
四.添加包含目錄。在項目屬性-》C++-常規-附加包含目錄中添加CUDA SDK的目錄。例如"C:\Program Files\NVIDIA Corporation\NVIDIA GPU Computing SDK 三.二\C\common\inc";"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v四.0\include"
5.添加.lib文件。在鏈接器-》輸入中添加cudart.lib cutil三二D.lib
陸.修改代碼生成為多線程(/MT)方式。
漆.Done.
以上是工程配置。
除此之外，還要把調用cuda代碼的c++函數在.cu文件中用extern "C" 包含起來
-

gpu資料庫開源

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座1

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座2

鯤鵬升騰夥伴數再擴，將與歐拉共築數字經濟底座3

與gpu資料庫開源相關的內容