#1 - 2018-5-18 22:59
ζ*'ヮ')ζ 讀者諸孃へ (愛讀者諸孃は御賛成下さいまし)
听说板鼓米上程序媛高达八成,因此特来职业相谈一下。

不过这次相谈的不是我,而是我从本校大数据专业新招的几个RA,有想进入IT业的。考虑到学生将来的职业发展,所以我也挺想能借着这次RA的机会,能让学生做一点对将来工作也有益处的事情就好了。聊了一下他们专业的知识结构大体是这样的:

  • CS类专业的一些基础课,比如数据库之类;
  • 常见的几种语言,比如C, JAVA, Python,可能还会学点R;
  • 统计学基础知识。

    现在学生大概是从来没听说过Stackoverflow的水平吧(bgm62) 也只是比较模糊地想要去业界做一点跟自己专业对口的技术性工作,对业界的了解大概还没我多……所以我就来咨询一下了:

  • 现在业界跟所谓“大数据”相关的岗位,主要需求哪些技术和能力(包括CS方面的和统计算法方面的)?
  • 了解一些统计算法对去业界有多大帮助?是不是学统计的时间不如拿来学CS?
  • 语言方面,是把Python学精就好,还是说适当再涉及一些其他的语言,比如说R会更好?
  • 是不是有必要做点其他的准备,比如说GitHub上的一个自己的小项目?做什么类型的项目会比较好?
  • 是否有必要去刷算法题?
  • #2 - 2018-5-18 23:40
    国内本科就有这个专业了吗(bgm38)
    #2-1 - 2018-5-19 14:08
    ζ*'ヮ')ζ 讀者諸孃へ
    现在才开这个专业已经比业界开始吹落后了好几年了吧(bgm39)
    #2-2 - 2018-5-19 21:44
    九八式衍射弹
    Ƹ̵̡Ӝ̵̨̄Ʒ 说: 现在才开这个专业已经比业界开始吹落后了好几年了吧
    我的意思是本科这个专业有点那啥,按理说是个研究生方向才对,感觉美国很少有好大学会在本科开这种研究生方向的专业,大家本科都还是学CS罢了
    #3 - 2018-5-18 23:43
    大数据专业是啥专业(bgm38)

    1,我觉得应该先提高码力,有了一定码力后面的问题才有意义
    2,CS数学基础课也包含概率统计微积分线代,掌握数学基础不分统计CS。掌握之后可以了解一些CS内容比如组成原理操作系统数据库网络编译原理等等,这算是提升码农内力的
    3,码力有了,语言就不是问题了
    4,项目可以有,不过建议先上上网络公开课,比如Berkeley的CS188,Caltech的机器学习。学懂之后做什么就很容易决定了
    5,前面几点都到了的话,面试之前几个月刷一刷题吧
    #3-1 - 2018-5-19 14:09
    ζ*'ヮ')ζ 讀者諸孃へ
    我理解就是比一般的CS专业多学了点统计,然后相对更强调Python和R这些语言,其他的好像没啥了(bgm39)
    #4 - 2018-5-18 23:56
    (Happy birthday.)
    大数据不就是不管用户的数据有没有用先收集起来再说吗
    去看下各个公司的招聘要求不就有了嘛
    就跟考试考啥就学啥一样的
    #5 - 2018-5-19 00:01
    (爱动漫,宅!‮‮‮‮‮‮‮‮‮‮‮‮ ... ... )
    数学 和算法
    数学的话 线性代数 图形学会遇到各种矩阵应用
    高等数学 在密码学里面也会有各种应用

    算法自然是基本的基本。。。 面试就爱考这个
    #6 - 2018-5-19 00:21
    (你谁啊?我准许你套近乎了吗?)
    很吃香的专业啊,为什么会连stackoverflow都不知道啊…………而且这点问题都不知道这些学生对社会的知识令人发指怎么会选择这个专业的。我的建议是,希望他们不要进入这个行业和我抢工作机会…………………………


    正经点的,编程和计算方面交给别人补完了。对应届生来说,其实能力要求不会太大。
    英语学好
    搞清楚自己是要做采集、储存还是分析(我觉得很奇怪为什么是这个没分开)
    R和python选一即可,但最好另一个至少还是知道一点。
    了解实事
    培养美感、会一点可视化,

    以及会回答“多大的数据才算大”这个问题(bgm39)
    #6-1 - 2018-5-19 12:43
    秘则为花
    以后改称“海量数据”了(bgm38)
    #6-2 - 2018-5-19 14:11
    ζ*'ヮ')ζ 讀者諸孃へ
    是妹子也不希望么
    可视化这个确实应该比较有用,多谢提醒(bgm25)
    然后能说一下数据采集大概是怎样的一类工作吗?是指类似于数据清洗这样的活?
    #6-3 - 2018-5-19 15:11
    老大
    Ƹ̵̡Ӝ̵̨̄Ʒ 说: 是妹子也不希望么
    可视化这个确实应该比较有用,多谢提醒
    然后能说一下数据采集大概是怎样的一类工作吗?是指类似于数据清洗这样的活?
    清洗还是都要会弄的。我的采集的意思是"制造"这些数据

    其实就是弄数据库,给人API用这样吧。具体不清楚, 我的逻辑是既然分析的人能随手扒到一大堆的数据,那总要有人维护吧。
    #7 - 2018-5-19 02:48
    (advaita)
    #7-1 - 2018-5-19 02:53
    九八式衍射弹
    看了下链接是进日志280364?没有这篇啊
    #7-2 - 2018-5-19 04:20
    九八式衍射弹
    良木 说: ?

    那试试这个,回复可见
    所以这到底是啥啊(bgm38)
    #7-3 - 2018-5-20 00:20
    Rくん
    九八式衍射弹 说: 所以这到底是啥啊
    You should get accustomed to Internet chatting: They are not oliged to answer your question.(bgm38)
    #8 - 2018-5-19 04:11
    学好英语 -> 考 GRE 来美国读研究生 -> 好好刷题 -> 进谷歌之类的大公司
    #9 - 2018-5-19 05:26
    (DD雷达搜寻中...?)
    假如你没毅力当上大神的话,我劝你还是打消这个念头吧
    #10 - 2018-5-19 07:28
    (休息一下,吃點炸雞漢堡吧)
    大數據我不太懂,我只說說我對cs的看法。

    本人大三,數學專業和計算機輔修,以後大概也是搞cs相關的領域,更具體來說是AI

    無論是哪個領域,都分成工程學和理論應用(有的還有純理論,比如數學),我是想搞理論應用,而理論革新核心毫無疑問是數學,所以我研究生(或博士)也是想申請數學方面。工程學主要是是對理論的實現,優化,修復和評估。首先你要看哪方面適合你。像我,算法和計算機架構都學得一般般,妥妥工程是搞不好的。假如你要這方面專長而且有興趣(這個很重要),那麼可以看看工程類的,多練習。但假如你想搞理論,舉個例子,編碼理論基本都是抽象代數,你得學數學。

    順便說一下職業傾向,純理論一般是對應學校系統,理論應用一般大公司或者國家核心開發團隊(比如說各種實驗室,有些實驗室可是拿了十幾個諾貝爾的),工程學就是工程師(比如碼農)

    國內的專業分法很模糊,你就把你自己當成cs的學生,別用大數據框住自己,儘量多瞭解自己喜歡做啥,專長是啥,未來的發展方向。別一開始就想著就職,連cs這領域最基本的狀態都不清楚。本人也想從事這方面,也在申請學校,算是經驗交流吧,希望有用(bgm38)(bgm38)(bgm38)
    #11 - 2018-5-19 12:15
    会写代码,学习能力,解决问题能力,有这三点基本就够了
    #12 - 2018-5-19 14:19
    (V1046-R MAHORO)
    为什么要用日语波浪号〜(bgm38)
    #12-1 - 2018-5-19 14:23
    ζ*'ヮ')ζ 讀者諸孃へ
    我们二刺螈就是这样的〜
    #13 - 2018-5-19 19:21
    (那谁谁家那小谁)
    统计很重要,英语很重要,码力很重要。
    具体会用什么框架什么算法相对不那么重要,因为这领域更新太快了。
    时刻保持对新技术新算法的接触就行了,培养对该领域技术的敏感性
    #14 - 2018-5-19 23:35
    (松鼠症患者)
    后排搬个板凳来听听。
    这里大一CS,将来也想做数据分析相关的职业...
    #14-1 - 2018-5-20 00:21
    Rくん
    去知乎围观啊b38
    #14-2 - 2018-5-20 16:02
    Black333
    Rくん 说: 去知乎围观啊b38
    知乎各种地方都看过了啊,但是依然很好奇bgm众的看法(bgm38)