当前位置:首页 » 数据仓库 » gpu数据库开源
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

gpu数据库开源

发布时间: 2023-01-19 16:53:34

1. nvidia/cuda 公开源中的devel和runtime有什么区别

从很多方面来看,CUDA和OpenCL的关系都和DirectX与OpenGL的关系很相像。如同DirectX和OpenGL一样,CUDA和OpenCL中,前者是配备完整工具包、针对单一供应商(NVIDIA)的成熟的开发平台,后者是一个开放的标准。
虽然两者抱着相同的目标:通用并行计算。但是CUDA仅仅能够在NVIDIA的GPU硬件上运行,而OpenCL的目标是面向任何一种Massively Parallel Processor,期望能够对不同种类的硬件给出一个相同的编程模型。由于这一根本区别,二者在很多方面都存在不同:

1)开发者友好程度。CUDA在这方面显然受更多开发者青睐。原因在于其统一的开发套件(CUDA Toolkit, NVIDIA GPU Computing SDK以及NSight等等)、非常丰富的库(cuFFT, cuBLAS, cuSPARSE, cuRAND, NPP, Thrust)以及NVCC(NVIDIA的CUDA编译器)所具备的PTX(一种SSA中间表示,为不同的NVIDIA GPU设备提供一套统一的静态ISA)代码生成、离线编译等更成熟的编译器特性。相比之下,使用OpenCL进行开发,只有AMD对OpenCL的驱动相对成熟。

2)跨平台性和通用性。这一点上OpenCL占有很大优势(这也是很多National Laboratory使用OpenCL进行科学计算的最主要原因)。OpenCL支持包括ATI,NVIDIA,Intel,ARM在内的多类处理器,并能支持运行在CPU的并行代码,同时还独有Task-Parallel Execution Mode,能够更好的支持Heterogeneous Computing。这一点是仅仅支持数据级并行并仅能在NVIDIA众核处理器上运行的CUDA无法做到的。

3)市场占有率。作为一个开放标准,缺少背后公司的推动,OpenCL显然没有占据通用并行计算的主流市场。NVIDIA则凭借CUDA在科学计算、生物、金融等领域的推广牢牢把握着主流市场。再次想到OpenGL和DirectX的对比,不难发现公司推广的高效和非盈利机构/标准委员会的低效(抑或谨慎,想想C++0x)。

很多开发者都认为,由于目前独立显卡市场的萎缩、新一代处理器架构(AMD的Graphics Core Next (GCN)、Intel的Sandy Bridge以及Ivy Bridge)以及新的SIMD编程模型(Intel的ISPC等)的出现,未来的通用并行计算市场会有很多不确定因素,CUDA和OpenCL都不是终点,我期待未来会有更好的并行编程模型的出现(当然也包括CUDA和OpenCL,如果它们能够持续发展下去)。

2. VDPAU是怎么与GPU交互的通过显卡驱动,还是 最大的问题就是怎么调用GPU

X
Window系统下的开源库(libvdpau)和
API实现显示,我个人的理解是系统先有支持x11
的驱动然后显卡的驱动也支持x
windows
,当软件的动作需要到x
windows
的时候,通过x11驱动API接口就把数据发送到x
windows
,然后因为显卡驱动支持所以GPU
可以根据X
windows
提供的开源库进行解码,然后通过x
windows
的api
接口输出!

3. 什麽是GPU,NPU,ASIC

  1. 图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。

  2. 嵌入式神经网络处理器(NPU)采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。

  3. ASIC被认为是一种为专门目的而设计的集成电路。是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。

(3)gpu数据库开源扩展阅读:

GPU在几个主要方面有别于DSP(Digital Signal Processing,简称DSP,数字信号处理)架构。其所有计算均使用浮点算法,而且此刻还没有位或整数运算指令。此外,由于GPU专为图像处理设计,因此存储系统实际上是一个二维的分段存储空间,包括一个区段号(从中读取图像)和二维地址(图像中的X、Y坐标)。此外,没有任何间接写指令。输出写地址由光栅处理器确定,而且不能由程序改变。这对于自然分布在存储器之中的算法而言是极大的挑战。最后一点,不同碎片的处理过程间不允许通信。实际上,碎片处理器是一个SIMD数据并行执行单元,在所有碎片中独立执行代码。

4. 开源精粹(二)!22个实用、有趣的开源项目

作为一名开源爱好者,发掘优秀的开源项目是一件非常有趣的事情。在第一期中,我分享了单页个人网站模板、组装式 Flutter 应用框架、PHP 客户端库、Java 诊断工具等一些实用的库和工具。本期依旧会为大家分享一些前端、后端、移动开发的相关工具,希望你能“淘”到适合自己的工具。

1.Vue-EasyTable

Vue-EasyTable 是一款基于 Vue2.x 的 table 组件,具备自适应、表头与列固定、自定义单元格样式、自定义 Loading 等功能。

2.React-Calendar

这是一款具备原生日期格式的日历组件。它不依赖 Moment.js,支持日期选择范围,涵盖了各国语言,开箱即用。

3.Matter

CSS 实现的 Material 组件合集项目,作者已将部分作品开源,效果可以在 CodePen 上查看。

4.Revery

Revery 是一款用于构建高性能、跨平台桌面应用的框架。它类似于加速版的原生 Electron,除了拥有类似 React / Rex 的库,还具备 GPU 加速渲染功能,其内置的编译器速度也相当快。

5.Web Accessibility Guide

这是一个精选了 Web 可访问性贴士、技巧和最佳实践的开源项目,你将会学习到一些改善 Web 可访问性的实用做法。

1.SOFAJRaft

SOFAJRaft 是蚂蚁金服开源的生产级 Java Raft 算法库,它基于 Raft 一致性算法的生产级高性能 Java 实现,支持 MULTI-RAFT-GROUP,适用于高负载低延迟的场景,易于使用。

2. Dragonwell

阿里开源了 OpenJDK 发行版 Dragonwell,它提供长期支持,包括性能增强和安全修复。在数据中心大规模 Java 应用部署情况下,可以大幅度提高稳定性、效率以及性能。

3.Lawoole

Lawoole 是一款基于 Laravel 和 Swoole 的高性能 PHP 框架。它兼具了 Laravel 的特点,还解决了其功能背后的性能问题。同时,你还能感受到与 Laravel 一样的编码体验。

4.AntNest

AntNest 是一个简洁、快速的异步爬虫框架。它仅有 600 行代码,基于 Python 3.6+.

5.PHP-Awesome

这个仓库汇集了 PHP 优秀的资源,供你查询和参考。

1.FlutterBoost

FlutterBoost 是闲鱼开源的新一代 Flutter-Native 混合解决方案。它能够帮你处理页面的映射和跳转,你只需要关心页面的名字和参数即可。

2.MyLayout

MyLayout 是一套 iOS 界面视图布局框架,可谓 iOS 下的界面布局利器。它集成了 iOS Autolayout、Size Classes、Android 的 5 大布局体系、HTML/CSS 的浮动定位技术以及 Flex-Box 和 Bootstrap 框架等主流的平台的界面布局功能,并提供了一套简单、完备的多屏幕尺寸适配的解决方案。

3.SegementSlide

SegementSlide 是一个 iOS UI 库,它具备完整的滑滚及切换组件,旨在解决多层 UIScrollView 嵌套滚动的问题。

1.DevHub

DevHub 是一款跨平台的 GitHub 通知管理客户端,支持 Android、 iOS、网页和桌面上使用,帮助你便捷的接收 GitHub 各类通知。

2.Reqman

Reqman 是一个帮助后端工程师进行 API 测试的工具,同时也是一个基于 Node.js 的爬虫工具。

3.FreeCodeCamp

说到 FreeCodeCamp,或许大家不会陌生,而这个项目就是他们建立的开源课程和相应的代码库。网站提供了 6 大认证课程,也涉及了全栈开发认证。如果你感兴趣,不妨了解下。

4.Gitter

Gitter 是 GitHub 小程序客户端,作者采用 Taro 框架 + Taro UI 进行开发,而小程序内数据则来自 GitHub Api V3.

5.Awesome Podcasts

这个项目收集了各类实用的播客,涵盖了主流的编程语言,希望对你提升技术水平有所帮助。 ​

6.编程图书大全

书籍不光能在你迷茫的时候,给予你答案,还能在你提升技能的时候,给予你帮助。这个仓库收集了众多编程图书,涉及主流编程语言、人工智能、算法、Linux、大数据等。看看,有木有你需要的。

7.VS Code Netease Music

很多开发者喜欢边写代码,边听音乐,VS Code Netease Music 这个插件就能满足你在 VS Code 上听歌的愿望。它使用 Webview 实现,不依赖命令行播放器。

Star-Battle

Star-Battle 是一款使用 JavaScript ES6、Canvas 开发的飞船射击类 游戏 。来 Enjoy 吧。 ​​​​

注:

如需转载,烦请按下方注明出处信息,谢谢!

5. 鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座

鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座

鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座,鲲鹏携手合作伙伴,已经全面进入各省市政务云、金融核心交易系统、运营商三朵云和电力调度等行业核心场景。鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座。

鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座1

6月15日,在华为伙伴暨开发者大会2022上,华为公司副总裁、计算产品线总裁邓泰华表示,华为始终坚持“硬件开放、软件开源、使能伙伴、发展人才”的生态策略,与伙伴合作共赢、共建生态。

他透露,目前,鲲鹏、升腾伙伴已经超过4500家,推出超过12000个行业解决方案,鲲鹏、升腾开发者数量超过200万,“智能基座”产教融合协同育人基地项目已经赋能了3000名教师,开设了1500门课程,覆盖30多万学生。

在硬件方面,邓泰华指出,今年华为伙伴出货占比已经超过90%。在基础软件方面,欧拉首个数字基础设施全场景版本今年3月已经发布;openGauss(开源高斯)数据库3.0版本也已上线并支持多场景;同时,鲲鹏两大开发套件实现升级,使能开发者高效原生开发。

鲲鹏携手合作伙伴,已经全面进入各省市政务云、金融核心交易系统、运营商三朵云和电力调度等行业核心场景。鲲鹏行业技术生态满足度稳步提升,今年预计达到75%,主流场景已经支持,软件生态兼容性的瓶颈已经消除。

邓泰华表示,欧拉开源两年以来,产业共建成果显着,发展超越预期。欧拉社区已经汇聚340多家全球企业,覆盖芯片、部件、整机等产业链成员;吸引近万名开源贡献者,参与社区技术创新和版本开发;全球120多个国家、1500多个城市用户累计下载量超过54万次。

目前,整个欧拉系统的装机量累计超过170万套,新增市场份额达到19%,预计年底将达到25%,明年将做到中国新增市场份额第一。

本次大会上,麒麟软件、统信软件、麒麟信安、SUSE、普华基础软件、拓林思、中科创达(300496)、科东软件、中科院软件所9家伙伴正式发布基于欧拉首个数字基础设施全场景版本的操作系统商业发行版,将社区创新成果应用于千行百业。

鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座2

在华为伙伴暨开发者大会2022上,华为公司副总裁、计算产品线总裁邓泰华发表“共建计算产业,共创数智未来”主题演讲,分享了鲲鹏、升腾、欧拉在商业、生态、技术方面的最新进展。本次大会,“中国算力网——智算网络”也正式上线。

据悉,鲲鹏、升腾伙伴目前已经超过4500家,推出超过12000个行业解决方案,鲲鹏、升腾开发者数量超过200万,“智能基座”产教融合协同育人基地项目已经赋能了3000名教师,开设了1500门课程,覆盖30多万学生。

鲲鹏深耕行业数字化 全面进入核心场景

鲲鹏持续升级基础软硬件平台,赋能伙伴和开发者,生态快速发展。在硬件方面,坚持伙伴优先,今年伙伴出货占比已经超过90%。在基础软件方面,欧拉首个数字基础设施全场景版本openEuler 22.03 LTS于今年3月发布;openGauss数据库3.0版本也已上线并支持多场景;同时,鲲鹏DevKit和鲲鹏BoostKit两大套件升级,使能开发者高效原生开发。

鲲鹏携手合作伙伴,已经全面进入各省市政务云、金融核心交易系统、运营商三朵云和电力调度等行业核心场景。鲲鹏行业技术生态满足度稳步提升,今年预计达到75%,主流场景已经支持,软件生态兼容性的瓶颈已经消除。

9家伙伴同期发布欧拉操作系统商业发行版

作为数字基础设施的开源操作系统,欧拉持续丰富南向和北向的生态支持。欧拉南向支持多样性设备,已经实现主流计算架构100%全覆盖,包括ARM、x86、RISC-V等全部主流CPU指令集,同时支持NPU、GPU和DPU等多种异构算力。

欧拉北向使能IT、CT和OT全场景应用,与伙伴协作,适配一万多款应用,主流应用场景100%支持。同时,通过共享分布式套件,进一步实现与鸿蒙互通,共同服务数字全场景。

欧拉开源两年以来,产业共建成果显着,发展超越预期。欧拉社区已经汇聚340多家全球企业,覆盖芯片、部件、整机、OSV、ISV等产业链成员;吸引近万名开源贡献者,参与社区技术创新和版本开发;全球120多个国家、1500多个城市用户累计下载量超过54万次。

目前,整个欧拉系的装机量累计超过170万套,新增市场份额达到19%,预计年底将达到25%,明年将做到中国新增市场份额第一。

本次大会上,麒麟软件、统信软件、麒麟信安、SUSE、普华基础软件、拓林思、中科创达、科东软件、中科院软件所9家伙伴正式发布基于openEuler22.03 LTS的操作系统商业发行版,将社区创新成果应用于千行百业。

升腾构建AI新生态 加速行业智能升级

人工智能加速行业落地,升腾AI发展恰逢其时。全国20多个城市规划和建设人工智能计算中心,其中,深圳、武汉、西安、成都、南京、杭州等多地的人工智能计算中心已相继上线,全部实现上线即饱和运营。AI算力,像水和电一样,成为城市数字基础设施公共资源,赋能数字经济发展。

本次大会,“中国算力网——智算网络”正式上线。智算网络是“中国算力网”一期工程的核心板块之一,标志着中国算力网计划的全面展开,是中国算力网络建设迈出的关键一步。未来,各地智算中心、超算中心、“东数西算”枢纽节点等,都可以并入中国算力网,形成支撑数字经济发展的统一算力大市场。

通过智算网络的建设,以东数西存、东数西算、东数西训为牵引,将逐步形成绿色集约的算力布局;未来还将汇聚多种社会算力,形成更加泛在的算力协同,并通过全网的算力交易流通,弹性满足全网范围内的算力需求,从科研创新、应用孵化、产业汇聚、人才发展等多方面助力人工智能产业高质量发展。

大模型全流程使能体系发布,共筑中国大模型生态

当前AI正在走向领域大模型,发展大模型已成为产业界共识,智算网络也为其发展带来新的机遇。为了更好地使能大模型发展,华为发布从规划、开发到产业化的大模型全流程使能体系,与产业界共筑中国大模型生态。该大模型全流程使能体系包括以下几方面:

规划升腾大模型沙盘,构筑中国大模型创新高地。过去的一年,产业界基于升腾AI先后推出鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列等有影响力的大模型。今年,华为发布升腾科研创新使能计划,鼓励高校和科研机构开展大模型的研究与创新,在每个领域和行业打造出世界级领先的大模型。

打造大模型开发使能平台,让大模型易开发、易适配、易部署。针对基础模型开发,华为推出升思MindSpore和ModelArts结合的大模型开发套件,通过算法开发、并行计算、存储优化、断点续训,实现大模型的高效开发。

为快速适配行业应用,推出基于MindX的`大模型微调组件,实现一键式微调和低参数调优。在模型推理部署方面,推出基于MindStudio的大模型部署套件,实现分布式推理服务化、模型轻量化和动态加密部署。

从科研创新到行业落地,开创大模型产业化新模式。去年,全球首个智能遥感框架武汉.LuoJia和全球首个三模态大模型紫东.太初,成立了智能遥感开源生态联盟和多模态人工智能产业联盟,已有60余家伙伴加入,陆续孵化出多个行业解决方案。今年,华为还将与伙伴一起,共同成立AI流体力学、AI生物医药、以及智慧育种等产业联盟,助力相关领域的大模型创新和产业化发展。

鲲鹏升腾伙伴数再扩,将与欧拉共筑数字经济底座3

2022年6月15日,在华为伙伴暨开发者大会2022上,华为公司副总裁、计算产品线总裁邓泰华公布了欧拉、鲲鹏、升腾在商业、生态、技术方面的最新进展及带来一系列最新发布:

中国算力网——智算网络正式上线;大模型全流程使能体系发布,共筑中国大模型生态;从科研创新到行业落地,开创AI大模型产业化新模式;发布行业数智化转型新架构,加速行业数字化转型和智能升级。

值得注意的是,此次,麒麟软件、统信软件等9家华为合作伙伴也正式发布了欧拉操作系统商业发行版。

邓泰华表示,截至目前,欧拉商业装机量累计超过170万套,新增市场份额达到19%,预计到今年底将达25%,明年的目标是做到中国新增市场份额第一。

据介绍,欧拉开源在金融、政府、交通等多个行业都得到了规模应用。

“市场的快速增长源于生态的繁荣。”邓泰华称,目前,欧拉社区已经融合全球340多家企业成员,覆盖全产业链;吸引了近万名开源贡献者参与社区技术创新和版本开发;来自全球120多个国家/地区1500多个城市的用户,累计下载量超过50万次。

除了欧拉之外,目前华为鲲鹏、升腾伙伴已经超过4500家,推出超过12000个行业解决方案,鲲鹏、升腾开发者数量超过200万。

欧拉、鲲鹏、升腾分别横跨了华为面向B端的计算业务、企业业务、云业务三大业务板块。

华为内部人士向《证券日报》记者透露,三大生态一下步将持续融合扩容,加速向B端市场发力。

6. 创原会:保险行业精英齐聚,共论云原生创新之道

1月15日,由创原会发起的“云原生技术精英沙龙(保险行业专场)”成功举办,来自中国信通院、华为云以及保险行业的技术精英,就“云原生提速保险行业数字化转型”以及“保险行业云原生典型应用场景”进行了深入探讨。


创原会是华为云联合CNCF、中国信通院及业界云原生技术精英们,构建的全球化云原生交流平台,旨在通过 探索 前沿云原生技术、共享产业落地实践,共创云原生与业务融合的无限可能。


云原生:保险行业数字化升级的必由之路

随着百姓保险意识的增强、“互联网+保险”对传统业务的颠覆创新,保险行业正经历一场产品、运营、业务模式全面升级的变革。

合众人寿信息技术总监顼颂表示:“我们希望扩大外部交流,引入新的技术,并通过平台化战略实现开放生态、跨界融合,进而与上下游渠道对接,建立一个整合了保险业务、数据、产品的体系,提高业务系统的灵活性和创新的敏捷性,实现以客户为中心,数字化驱动、智慧经营的 科技 发展目标。”

中国信通院云大所云计算部副主任陈屹力,在会上分享了云原生技术与保险业务融合的趋势洞察。他认为:“ 云原生是保险行业新一轮数字化升级的必由之路, 其开放、敏捷、标准的特点,能快速帮助企业构建开放的平台,更好地支撑业务的快速发展和创新,实现降本增效。未来的1至3年,保险行业将迎来全面云原生化的时代。”


云原生基础设施:为保险业务构建高效的云原生底座

互联网加持下的保险业务,呈现出交易频次高、流量大等特点。同时,保险业务与不同行业的融合,也对业务敏捷创新提出了更高的要求。

华为云云原生解决方案资深架构师吉硕在会上介绍:“华为作为全球领先的ICT基础设施和智能终端提供商,在自有业务升级、服务全球客户的过程中,已实现超大规模企业云原生实践。我们将这些经验与华为云服务相结合,打造了更适合传统行业客户大规模落地云原生的解决方案。”

华为云基于擎天架构打造 “以应用为中心”的云原生基础设施,为客户构建全栈云原生业务,提供了高效、敏捷的云原生基础设施平台。

通过提供x86、GPU、鲲鹏、升腾等多样性算力,华为云满足保险行业核心交易、互联网业务、AI及大数据业务对算力的差异化诉求,并基于擎天架构的软硬协同能力,充分发挥出云原生基础设施性能,满足业务大规模部署、大业务量并发的需求;同时,云原生多云平台帮助客户快速构建多地多中心业务治理能力,实现跨地域的资源调度、业务扩容、流量治理;此外,标准、开放的应用管理平台,实现各类云原生应用共平台部署,提升了业务的开发、运行、运维效率。


云原生数据库:保障保险业务数据的高效与安全

保险业务的快速发展,各企业数据库数据量可高达几十、数百TB,数据库如何扩展、如何最大限度的发挥这些数据的业务价值,是困扰保险行业的难题。

华为云数据库聚焦全场景云服务,推出了云原生数据库GaussDB,其基于统一的存算分离架构,兼容openGauss及主流开源数据库生态,支持关系型与非关系型数据库,并构建了多生态兼容、层次解耦、多副本强一致、数据融合、算子下推等云原生能力。GaussDB的极致性能解决了企业海量数据读写带来的压力。同时,数据跨AZ高可用、RPO=0、RTO秒级,满足了保险行业监管的要求,且完整的工具链,可帮助企业快速完成数据的平滑迁移,确保业务数据0丢失。

目前,华为云云原生解决方案已广泛应用在永安保险、众惠保险等多家保险行业的标杆企业,帮助企业重塑云原生业务架构,加速企业数字化升级。

聚八方领航者,论云原生之道。未来,创原会成员将继续与各行业的云原生技术精英一起,持续赋能“新云原生企业”,加速云原生技术落地与产业繁荣。


视频加载中...


7. 15 个开源的顶级人工智能工具

斯坦福的专家在人工智能报告中得出的结论:"越来越强大的人工智能应用,可能会对我们的 社会 和经济产生深远的积极影响,这将出现在从现在到2030年的时间段里。"

以下这些开源人工智能应用都处于人工智能研究的最前沿。

1.Caffe

它是由贾扬清在加州大学伯克利分校的读博时创造的,Caffe是一个基于表达体系结构和可扩展代码的深度学习框架。使它声名鹊起的是它的速度,这让它受到研究人员和企业用户的欢迎。根据其网站所言,它可以在一天之内只用一个NVIDIA K40 GPU处理6000万多个图像。它是由伯克利视野和学习中心(BVLC)管理的,并且由NVIDIA和亚马逊等公司资助来支持它的发展。

2. CNTK

它是计算机网络工具包(Computational Network Tookit)的缩写,CNTK是一个微软的开源人工智能工具。不论是在单个CPU、单个GPU、多个GPU或是拥有多个GPU的多台机器上它都有优异的表现。微软主要用它做语音识别的研究,但是它在机器翻译、图像识别、图像字幕、文本处理、语言理解和语言建模方面都有着良好的应用。

3.Deeplearning4j

Deeplearning4j是一个java虚拟机(JVM)的开源深度学习库。它运行在分布式环境并且集成在Hadoop和Apache Spark中。这使它可以配置深度神经网络,并且它与Java、Scala和其他JVM语言兼容。

4.DMTK

DMTK分布式集齐学习工具(Distributed Machine Learning Toolkit)的缩写,和CNTK一样,是微软的开源人工智能工具。作为设计用于大数据的应用程序,它的目标是更快的训练人工智能系统。它包括三个主要组件:DMTK框架、LightLDA主题模型算法和分布式(多义)字嵌入算法。为了证明它的速度,微软声称在一个八集群的机器上,它能够"用100万个主题和1000万个单词的词汇表(总共10万亿参数)训练一个主题模型,在一个文档中收集1000亿个符号,"。这一成绩是别的工具无法比拟的。

5.H20

相比起科研,H2O更注重将AI服务于企业用户,因此H2O有着大量的公司客户,比如第一资本金融公司、思科、Nielsen Catalina、PayPal和泛美都是它的用户。它声称任何人都可以利用机器学习和预测分析的力量来解决业务难题。它可以用于预测建模、风险和欺诈分析、保险分析、广告技术、医疗保健和客户情报。

它有两种开源版本:标准版H2O和Sparking Water版,它被集成在Apache Spark中。也有付费的企业用户支持。

6.Mahout

它是Apache基金会项目,Mahout是一个开源机器学习框架。根据它的网站所言,它有着三个主要的特性:一个构建可扩展算法的编程环境、像Spark和H2O一样的预制算法工具和一个叫Samsara的矢量数学实验环境。使用Mahout的公司有Adobe、埃森哲咨询公司、Foursquare、英特尔、领英、Twitter、雅虎和其他许多公司。其网站列了出第三方的专业支持。

7.MLlib

由于其速度,Apache Spark成为一个最流行的大数据处理工具。MLlib是Spark的可扩展机器学习库。它集成了Hadoop并可以与NumPy和R进行交互操作。它包括了许多机器学习算法如分类、回归、决策树、推荐、集群、主题建模、功能转换、模型评价、ML管道架构、ML持久、生存分析、频繁项集和序列模式挖掘、分布式线性代数和统计。

8.NuPIC

由Numenta公司管理的NuPIC是一个基于分层暂时记忆理论的开源人工智能项目。从本质上讲,HTM试图创建一个计算机系统来模仿人类大脑皮层。他们的目标是创造一个"在许多认知任务上接近或者超越人类认知能力"的机器。

除了开源许可,Numenta还提供NuPic的商业许可协议,并且它还提供技术专利的许可证。

9.OpenNN

作为一个为开发者和科研人员设计的具有高级理解力的人工智能,OpenNN是一个实现神经网络算法的c++编程库。它的关键特性包括深度的架构和快速的性能。其网站上可以查到丰富的文档,包括一个解释了神经网络的基本知识的入门教程

10.OpenCyc

由Cycorp公司开发的OpenCyc提供了对Cyc知识库的访问和常识推理引擎。它拥有超过239,000个条目,大约2,093,000个三元组和大约69,000 owl:这是一种类似于链接到外部语义库的命名空间。它在富领域模型、语义数据集成、文本理解、特殊领域的专家系统和 游戏 AI中有着良好的应用。该公司还提供另外两个版本的Cyc:一个可免费的用于科研但是不开源,和一个提供给企业的但是需要付费。

11.Oryx 2

构建在Apache Spark和Kafka之上的Oryx 2是一个专门针对大规模机器学习的应用程序开发框架。它采用一个独特的三层λ架构。开发者可以使用Orys 2创建新的应用程序,另外它还拥有一些预先构建的应用程序可以用于常见的大数据任务比如协同过滤、分类、回归和聚类。大数据工具供应商Cloudera创造了最初的Oryx 1项目并且一直积极参与持续发展。

12.PredictionIO

今年的二月,Salesforce收购了PredictionIO,接着在七月,它将该平台和商标贡献给Apache基金会,Apache基金会将其列为孵育计划。所以当Salesforce利用PredictionIO技术来提升它的机器学习能力时,成效将会同步出现在开源版本中。它可以帮助用户创建带有机器学习功能的预测引擎,这可用于部署能够实时动态查询的Web服务。

13.SystemML

最初由IBM开发,SystemML现在是一个Apache大数据项目。它提供了一个高度可伸缩的平台,可以实现高等数学运算,并且它的算法用R或一种类似python的语法写成。企业已经在使用它来跟踪 汽车 维修客户服务、规划机场交通和连接 社会 媒体数据与银行客户。它可以在Spark或Hadoop上运行。

14.TensorFlow

TensorFlow是一个谷歌的开源人工智能工具。它提供了一个使用数据流图进行数值计算的库。它可以运行在多种不同的有着单或多CPU和GPU的系统,甚至可以在移动设备上运行。它拥有深厚的灵活性、真正的可移植性、自动微分功能,并且支持Python和c++。它的网站拥有十分详细的教程列表来帮助开发者和研究人员沉浸于使用或扩展他的功能。

15.Torch

Torch将自己描述为:"一个优先使用GPU的拥有机器学习算法广泛支持的科学计算框架",它的特点是灵活性和速度。此外,它可以很容易的通过软件包用于机器学习、计算机视觉、信号处理、并行处理、图像、视频、音频和网络等方面。它依赖一个叫做LuaJIT的脚本语言,而LuaJIT是基于Lua的。

欢迎关注~

微信公众号: IT百战程序员 ,免费提供人工智能、大数据、云计算等资料~~不管你在地球哪个方位,欢迎你的关注!

8. 有哪些优秀的CUDA开源代码

在已有工程上右键单击,选择添加已有项。
二.添加编译规则。右键单击工程文件,选择自定义生成规则,在弹出的对话框中选择CUDA Build Rule x.x。
三.修改.cu文件的编译器。右键单击.cu文件,单击属性,修改编译规则,选择刚才添加的CUDA编译器。
四.添加包含目录。在项目属性-》C++-常规-附加包含目录中添加CUDA SDK的目录。例如"C:\Program Files\NVIDIA Corporation\NVIDIA GPU Computing SDK 三.二\C\common\inc";"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v四.0\include"
5.添加.lib文件。在链接器-》输入中添加cudart.lib cutil三二D.lib
陆.修改代码生成为多线程(/MT)方式。
漆.Done.
以上是工程配置。
除此之外,还要把调用cuda代码的c++函数在.cu文件中用extern "C" 包含起来
-