对有志于成为数据科学家的人的建议

Access ready-to-use Telemarketing Data to expand outreach, generate quality leads, and maximize your marketing ROI.
Post Reply
tanjimajha12
Posts: 246
Joined: Mon Dec 23, 2024 4:57 am

对有志于成为数据科学家的人的建议

Post by tanjimajha12 »

您认为数据分析师和数据科学家需要具备哪些最重要的技能,包括技术和软技能?
Ramasubramanian Sundararajan: 据说数据科学家需要三项技能——建模、编程和领域知识。要想有效,这三项技能都同等重要。在我看来,关键是要掌握好这三项技能的基础知识 意大利手机号码列表 。扎实的基础统计学知识、对算法的良好理解、将业务问题转化为正确的技术问题的能力,以及最重要的是,能够提出关键问题以了解分析在特定业务环境中的价值。许多数据科学家倾向于尝试将尽可能多的工具塞进他们的工具包中——对他们有效性的真正考验实际上是他们是否能够在正确的场合使用正确的工具。

至于软技能,有很多。善于倾听,学会在回答如何解决问题之前先问为什么要解决问题,学会良好地沟通以说服决策者接受复杂性,等等。

有志于从事数据工作的人士应该在处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?
Ramasubramanian Sundararajan: 下意识的回答是,有抱负的数据科学家应该花大量时间处理杂乱的数据,这样他们才能学会如何有效地处理现实世界的问题。这确实是必要的。然而,最好先使用简单、干净的数据集学习各种建模技术,这样人们才能掌握这些技术和直觉,然后再逐渐学习更杂乱的数据集,因为那里的情况不那么明显。

您预见到数据科学领域的变化趋势是什么?您建议当前的数据分析师如何跟上步伐?
Ramasubramanian Sundararajan: 从很多方面来看,在我们构建的模型中引入复杂性已经变得更容易了。库的易用性可以帮助我们自动化很多我们过去必须手动编写的代码,预训练模型和迁移学习机制使我们能够从我们自己的问题和数据集以外的其他问题和数据集中进行隐性学习,机制可以相对轻松地并行化大问题等等。但复杂性总是伴随着高昂的代价——在模型中引入复杂性的容易性只会强调复杂系统的隐性成本。

对于数据科学家来说,这带来了一些有趣的挑战。在神经网络文献中有一个术语:稳定性-可塑性困境。简而言之,智能系统既要具有足够的可塑性以适应新信息,又要具有足够的稳定性,不会完全忘记旧信息。这就是数据科学家面临的问题。他们需要紧跟最新发展,但又要有机地吸收新知识,不要得意忘形,尽可能使用自动化工具,同时找到创造性的方法来利用领域知识和技巧来改进他们的结果。
Post Reply