关于寻找研究课题。一个数据科学家的笔记

0

数据科学家和物理学家 Ilan Dan-Gur 他写道,他如何能够找到并追求利用其技能并有可能对现实世界产生影响的研究课题。 

找到一个有趣的、值得研究的课题,并将你所有的教育和热情用于研究,是许多没有全职工作的科学家的核心问题。当搜索平台,如 科拉布树 为那些可能受益于你的知识的项目服务是一个重要的选择,可能会带来经济收益和帮助他人的个人满足感,你也可能觉得有必要找到自己的研究课题,作为一种创业的方式,或者为自己扬名,展示自己的能力。

然而,科学家们越来越相信,随着科学知识体系的不断壮大,现在寻找有趣的研究课题比以往任何时候都要困难。保罗-狄拉克在晚年谈到量子力学的早期时曾说过一句著名的话。"在那些日子里,任何二流的物理学家都很容易做一流的工作......现在一流的物理学家很难做二流的工作。"但是,如果你不希望产生任何如此宏伟的东西,如果你挖掘有关你感兴趣的主题的信息和数据,你可能会找到机会,即使你是在家里工作,只使用你的电脑和WiFi(以及你的大学教育,调查的热情,也许还有当地的公共图书馆)。例如,你可能能够以一种新的方式分析现有的数据,而这种方式是没有人想到的(或者至少是没有人发表过的),或者也许你将能够为目前的收集的数据添加新的数据。

我接受的正规教育是物理学和电子光学,虽然我自己的经验显然是主观的,但我想提供四个例子,说明我能够 "单枪匹马"(好吧,科学中没有什么是真正的)在家里(或很多时候在咖啡馆)思考和研究的课题,这些课题需要应用我的科学知识,有合理的机会吸引公众的兴趣,而且做起来很兴奋,因为它们保证为世界上已有的知识体系增加一些独特的东西。

1.美国的地域性癌症集群。

美国公共卫生记录的大型数据库可以免费使用[1],由美国政府提供。2017年,在浏览美国不同州的癌症发病率数据,并使用谷歌进行基本的在线研究时,我突然想到,还没有一篇文章关注癌症发病率高的州之间的共同边界。具体来说,没有一篇文章简单地统计了癌症发病率最高的州之间的共同边界的数量,即使做这样的分析的数据在CDC网站上很容易获得,而且调查会很直接和容易做。换句话说,我的意图是利用大量的数据,以一种前所未有的方式将数据 "连接起来"(即组织起来),同时有意忽略了更复杂的问题,即这种分析是否有用以及对谁有用。我在我的网站上公布了调查和结果[2],以及一个二级统计分析[3]。

此外,在做分析和看数据时,我意识到有必要创造和定义一个新的术语,这是分析的核心,即 "共享边界比率",这为调查增加了兴奋点。

2.美国人的长寿

与上面的例子1类似,利用美国的统计死亡率数据,我想出并调查了与长寿有关的独特问题[4]。

3.皮肤痣图像数据库

虽然今天有大量的移动应用程序可以分析皮肤上的痣是否有癌症迹象,但早在智能手机应用程序流行之前,我是第一个向公众提供关于皮肤癌迹象的免费建议的人[5],以换取他们在我的网站上张贴痣的图像。虽然我的目的是教育公众有关皮肤癌的迹象,以及宣传我为进行分析而编写的软件(见下面的例子4),但提供免费分析的结果是最大的用户提供的皮肤痣图像的在线数据库[6],后来我发现,这些图像被用于2015年出版的一本讨论数学和统计学进步(与我自己的网站和分析无关)的书中(有我公司Opticom Data Research的适当认证)[7, 8]。

4.皮肤痣自动分析

2001年,在被不同的皮肤科医生告知我有患皮肤癌的高风险,并经历了八次皮肤活检后,我决定编写(并尝试销售)一个用于个人电脑的软件(当时我用C++编写[9],最近翻译成JavaScript,在网络浏览器上免费使用[10,11,12]),分析痣的图像。在智能手机和移动应用程序开始流行之前,我就能够在全球范围内销售C++软件的副本,以及我设计的一个简单的机械附件,用于将相机紧贴皮肤。

参考文献

  • [1] https://wonder.cdc.gov/DataSets.html
  • [2] http://opticomdataresearch.com/statistics/cancer/clusters/main.htm
  • [3] http://opticomdataresearch.com/statistics/cancer/clusters/shared-borders-statistics.htm
  • [4] http://opticomdataresearch.com/statistics/how-long-will-i-live.htm
  • [5] https://www.prweb.com/releases/2008/07/prweb1060104.htm
  • [6] http://opticomdataresearch.com/mobile/mole-on-skin.htm
  • [7] 计算机代数的应用(斯普林格数学和统计学论文集,2015)。
  • [8] https://books.google.ca/books?id=tW0uDwAAQBAJ&pg=PA184&dq=opticom+数据+研究
  • [9] http://opticomdataresearch.com/molesense.htm
  • [10] https://chrome.google.com/webstore/search/skin%20cancer
  • [11] http://opticomdataresearch.com/mobile/skin-cancer-image-search.htm
  • [12] http://www.opticomdataresearch.com/mobile/atypical-mole.htm

 


Kolabtree帮助全球企业按需雇佣专家。我们的自由职业者已经帮助企业发表研究论文,开发产品,分析数据,以及更多。只需一分钟就可以告诉我们你需要做什么,并免费获得专家的报价。


分享。

关于作者

伊兰是一位物理学家、数据科学家和统计学家。他对计算机算法、皮肤病学和数据挖掘感兴趣。他拥有位于加拿大的Opticom数据研究公司,并且是Kolabtree的自由职业者。

发表回复

值得信赖的自由职业者专家,随时为您的项目提供帮助


世界上最大的科学家自由职业平台  

不,谢谢,我现在不打算雇用。