锤子简历品牌推广师
应该添加到简历中的开源数据分析项目
作者:君仔小编 2022/05/23 00:05:10
阅读 165
应该添加到简历中的开源数据分析项目

开源机器学习项目

这是您学习机器学习的地方。

我们将在这里介绍与机器学习有关的三个有用的开源项目。

您可以根据自己的兴趣选择一个项目,也可以全部尝试。

我试图使它们尽可能多样化,以便您会看到有关机器学习论文的项目以及构建机器学习管道的另一个项目。

带有插图和注释的机器学习论文

对于大多数专业人士,更不用说初学者了,阅读机器学习研究论文的前景相当艰巨。

数据分析师和机器学习研究人员倾向于撰写极其技术性的论文,甚至专家也很难解码。

这实际上是我们领域中最大的痛点之一。

因此,任何打破复杂性的努力总是值得欢迎的。

这个有用的项目是数据分析和机器学习论文的集合,“其中包括插图,注释以及对技术关键词,术语和以前的研究的简要说明,这使阅读论文和获得主要思想变得更加容易”。

NeoML –机器学习框架

对于任何有一点数据分析知识的人来说,这都是一个非常有趣的项目。

NeoML是一个全面的机器学习框架,使我们能够构建,训练和部署机器学习模型。

简而言之,我们可以建立一个端到端的机器学习管道,而不必花很多钱在开箱即用的解决方案上。

数据分析师和数据工程师可以将其用于计算机视觉和自然语言处理(NLP)任务,例如图像预处理,分类,文档布局分析,OCR以及从结构化和非结构化文档中提取数据。

这是我从其GitHub存储库中获取的NeoML的主要功能:

支持超过100种图层类型的神经网络

传统机器学习:20多种算法(分类,回归,聚类等)

CPU和GPU支持,快速推断

ONNX支持

语言:C ++,Java,Objective-C

跨平台:相同的代码可以在Windows,Linux,macOS,iOS和Android上运行

Google的Caliban机器学习

这是任何数据分析师都会喜欢的另一个项目,特别是如果您倾向于研究的话。

我们通常很难从测试环境过渡到全面部署–这并非易事(我们真的应该感谢数据工程师所扮演的角色)。

Google当然会以Caliban的形式为我们提供潜在的解决方案。

这是一个可帮助您在隔离的,可复制的计算环境中启动和跟踪数值实验的工具。

Caliban由Google的机器学习研究人员和工程师开发。

正如他们所说,Caliban“使从工作站上运行的简单原型到在云上运行的数千个实验性工作变得容易”。

以下是您应注意的主要重点:

在本地开发实验代码并在隔离(Docker)环境中进行测试

轻松浏览实验参数

将实验提交为Cloud作业,它们将在相同的隔离环境中运行

控制并跟踪工作

开源计算机视觉项目

我对我们在计算机视觉中看到的进步感到惊讶(没有双关语!)。

似乎每个月我坐下来写这篇文章时,我都会遇到越来越多的突破性框架和新方法,这些框架和新方法增强了该领域的最新水平。

组织现在正在全球搜寻计算机视觉人才,因此现在是开展这些项目并进入该领域的好时机。

基因图

如果我给您目标图像并要求您编写一个从头开始创建图像的计算机视觉程序该怎么办?是的,这就是计算机视觉的力量!

脉冲–脸部去像素器

这个开源项目迎合了稍微高级的数据分析师。

要了解此项目的含义,我们需要掌握单图像超分辨率的概念。

简而言之,这里的目的是从相应的低分辨率输入中构建高分辨率图像。

听起来像是经典的计算机视觉项目!

PULSE是解决此问题的新颖方法。

PULSE是通过潜伏空间探索进行照片升采样的缩写,它以令人难以置信的高分辨率生成高分辨率和超逼真的图像。

而且这是完全以自我监督的方式完成的,并不局限于训练过程中使用的特定降级操作员。

其他开源数据分析项目

这是几个不完全符合以上两个类别的开源数据分析项目。

这实际上是两个截然不同的项目–一个迎合数据分析的初学者,而另一个则涉及强化学习的领域。

选择最适合您的一个,然后开始探索。

​​​​

内容来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:2772182309进行删除。