对于那些想要在数据分析科学行业中建立职业生涯的新手、数据科学学生或从业者,您有什么建议?
(a)编程和软件技能——R、Python、SAS 或 Excel
(b)可视化工具
(c)统计基础和应用知识
(d)机器学习
拉加夫巴厘岛:
(a)编程和软件技能——R、Python、SAS 或 Excel
Python 是解决数据科学问题 智利手机号码数据库 最广泛使用的语言,但根据用例和组织,R、Julia、SAS 甚至 MATLAB 也可用于解决数据科学问题。我的建议是了解基础知识,成为其中的专家,并在有需要时愿意探索新平台。
(b)可视化工具
Matplotlib、SeaBorn 和 Plotly 的使用最为广泛。R 世界依赖于 GGplot,Python 中也有可用的包装器和扩展。对于情节提要和仪表板,Tableau、Kibana 等工具被广泛使用。可视化是任何数据科学项目生命周期的重要组成部分。具有视觉表达能力有助于获得企业的信任和认可。
(c)
R 拥有庞大的优秀软件包库,涵盖了统计学的大多数领域。这个列表很长,我在这里就不多说了,但请放心,只要有一个概念,你就会找到它在 R 中的实现。
几年前,Python 的情况有所不同。该生态系统已经足够成熟,不仅成为深度学习和机器学习的首选平台,也成为统计研究的首选平台。
为了了解基础知识和基础概念,我建议看一下弗里德曼的精彩著作“统计学习要素”。
(d)机器学习
机器学习发展如此之快,以至于很难跟踪最新和最伟大的技术。然而,大多数研究都依赖于微积分、线性代数和概率的基础知识。当然,还有许多其他重要概念,但你需要明确打下坚实的基础。大多数机器学习和深度学习概念和算法都利用这些基础知识来构建令人惊叹的学习系统。
机器学习算法分为监督学习、非监督学习、半监督学习和强化学习,它们都有自己的概念,这些概念都是建立在基础知识之上的。我建议从 Coursera、Udemy 和其他 MOOC 上的 ML 在线课程开始。
统计基础与应用知识
-
tanjimajha12
- Posts: 246
- Joined: Mon Dec 23, 2024 4:57 am