入门基础¶
Python is a language for consenting adults. —Alan Runyan
编程语言: Python(Golang请参考 go 章节)¶
Python入门相对容易又可以干很多事(网站,运维,数据分析,爬虫,AI,量化投资等),是一门方便的工具语言。2016年TIOBE排名显示Python已经名列第四,成为脚本语言之首。 国外的Youtube,Instagram,Pinterest,Reddit,Dropbox,Disqus, Quora等知名应用一开始都是基于Python构建,国内的豆瓣,知乎,今日头条,果壳,饿了么,搜狐等也是Python应用的典型。这也给了国内Python开发者一阵强心剂,Python的生态环境可以支撑起重量级的 产品。这里不想挑起语言之争,php,nodejs,java,ruby等都有丰富的生态环境。不过目前来看,技术选型用Python在招聘、学习、培训、敏捷开发等方面还是一个比较折中的选择(主要在于人,而不是语言)。 python,ruby之类的动态语言优势在于其生产力,你能在极短时间内就搭建出原型从而赢得产品竞争。 推荐一下几本个人认为比较好的Python书籍:
《python-guide》 requests作者写的guide,偏向工程方面
《use python》 use python
《A Byte of Python》 一百多页的小书,可以快速熟悉Python语言。
《Python核心编程》 比较全面的Python书籍,介绍了Python语言的方方面面。
《Dive Into Python》 一本免费的开源书
《Fluent Python》 Python进阶的好书,没有之一,涉及了很多Python高级主题和实现特性。
《Python3 Cookbook》 Python进阶读物,汇集了很多技巧。
《Dabeaz》 Python 培训领域 number one,Pycon 常客,有很多高质量的教程
《Python Cheatsheet》 Python 语法快速参考
当然还有Python的官方文档作为参考,不过有些文档比较晦涩,还是推荐书籍入门。网上目前也可以搜到很多免费的电子书。 如果有时间可以看看国内廖雪峰写的Python教程,简单易懂,就是跳跃有点大(有些章节对新人来说不是很友好)。
算法与数据结构¶
编写良好的代码需要了解常用的算法和数据结构,虽然你可能很少会自己实现,但是对于Python语言中一些常用数据结构如list, tuple, set, frozenset, dict和collections模块中的OrderedDict, defaultdict, deque, namedtuple, Counter等应该知道什么时候用。最主要的还是了解算法中递归,二分等常用思想,写出高效易用的代码。如果你想在线练习,可以做一些Acm基础题或者去leetcode等网站刷题。 推荐书籍:
《Python 算法与数据结构中文教程》 笔者自己撸的一个教程,包含免费的讲义和代码以及付费视频。
《网易云课堂-Python 算法与数据结构教程》 Python 算法和数据结构视频教程
《算法导论》 你可以挑选感兴趣的章节啃一啃,也可以去网易公开课看下视频教程。如果不是计算机专业的可以看下《计算机科学导论》这门公开课,正好也是以Python语言讲解的。
计算机网络¶
对于应用开发者来说大部分时间可能不太会接触特别底层的问题,但是了解网络的运行原理还是必要的。网上有个面试题 从输入URL 到页面加载完成的过程中都发生了什么事情? 如果对其中大部分的概念都了解就算是入门了。网络相关书籍可以随便找一本看看。Http协议对于web开发者来说比较重要,需要深入了解。推荐书籍:
《图解Http》 一本小白入门Http协议的好书,有大量图片示例。
《Http权威指南》 Http协议最权威的讲解,大部头著作,可以看看最基础的部分。
《网络爬虫教程》 非常不错的爬虫教程。感谢原作者,其实感觉这种把学习的内容总结成小书的方式很好。
网络/并发编程(进阶)¶
如果想要深入了解一些网络框架的底层原理就需要学习底层socket网络编程了,比如《unix 网络编程》,《Linux 高性能服务器编程》等。 推荐一些入门资料:
Linux系统¶
互联网时代软件慢慢从传统的桌面软件到移动端、浏览器演化(这其实也是脚本语言能在 IO 密集的 web 领域使用广泛的原因),虽然 Linux 在桌面领域上完败,但是其开源和低成本的特性在网站服务器端、学术和工程领域使用广泛。 大部分Python应用都是跑在Linux服务器上的,大部分开源服务器软件使用的也是linux系统,即使日常工作不使用linux,一些基本的linux命令也要了解。 比如常用的文件操作,目录操作,进程操作等。你可以使用类unix系统mac或者linux版本ubuntu作为学习环境。 推荐:
《CONQUERING THE COMMAND LINE》 掌握这上面的命令基本就可以满足日常需求了。
《13 Linux Network Configuration and Troubleshooting Commands》
《鸟哥的Linux私房菜.基础学习篇》 浅显易懂,入门Linux命令的好书。
数据库¶
了解常用的关系型和非关系型(NoSQL, Not Only SQL)的数据库的使用。 现在网站业务后端用得比较多的数据库:
传统关系型数据库(mysql等),使用广泛,不够灵活
内存型(k-v型)数据库(redis等)
文档型数据库(mongodb等)
列式存储(HBase),大数据场景下的 IO 问题
全文搜索型(Elasticsearch)
每种数据库各有优势和其使用场景,后端程序员需要了解下不同类型数据库的使用方法和应用场景,灵活应用到后端存储设计之中。 关于各种数据库网上已经有不少资料,读者可以自行搜索学习,mysql 和 redis(包括使用、设计、原理、优化)是重中之重。可以看看《Mysql 必知必会》和《Redis 实战》 对大数据感兴趣的可以学习下 Hadoop 生态系统。
《Designing Data-Intensive Applications》 了解各种数据存储模型,本书覆盖面很广,适合有一定基础的人阅读
python 相关库的使用¶
python一大优势在于数量丰富的库,灵活使用各种python库能帮助我们快速做出产品。作为web开发者,你需要了解常用python库和框架的使用,比如django/flask/tornado/sqlalchemy/requests/pandas等。
web 框架¶
大部分后端业务逻辑开发中都会使用 web 框架,提升开发效率。常用的 python web 框架有 Django、Flask、Tornado 等,一般 web 框架都包含 http 处理、表单验证、模板引擎、ORM 、Restful 接口等,最好能熟练掌握一个 web 框架,帮助快速做出产品。
版本控制¶
目前最流行的应该就是git了,很多公司使用 gitlab 管理代码仓库。版本控制工具是多人协作必不可少的工具,入门的程序员需要掌握基本的git命令,可以把github作为个人练习的工具。 遵守你们公司的 git 工作流程,git 是一个很强大但是很容易被初学者错误使用的工具。
Web 服务器¶
Nginx 目前很流行,使用比较广泛,推荐学习和使用。熟悉基础的 LNMP 架构(Linux + Nginx + Mysql + Python),目前很多公司采用了都是多语言+微服务架构(基于 docker)。 你可能需要了解常见的 web 应用部署方式以及如何使用 nginx 等负载均衡
微服务架构¶
目前很多流行的网站采用了微服务架构,每个团队负责维护自己的服务(逃离单体地狱)。以下是学习微服务的一些比较好的书籍。
《微服务设计》 入门微服务概念的一本书
《微服务架构设计模式》 评价颇高的一本微服务实践书籍(java语言)
前端知识¶
基本的 html,css,javascript 需要有所了解。很多后端工程师需要做一些工具或者管理后台之类的,了解前端知识会有帮助。如果有兴趣深入前端可以了解下 Vue/React/Angular 等流行的框架。
学习和搜索能力¶
初学者碰到的大部分技术问题都是可以通过 google 解决的,用好 google/stackoverflow/github 和各种技术论坛、牛人博客等能帮助你了解最新的技术。
《Instagram Engineering》 Instagram 技术博客,有不少 python 相关的技术文章
业务领域知识¶
不同公司业务不同,经营(挣钱)领域不同(游戏、广告、媒体、社交、金融等),可能需要了解相关领域知识,方便业务建模。建议找工作之前研调下相应公司、经营领域、使用的技术栈等,不要太盲目,找到自己感兴趣的方向(后端知识很广),有时候方向和平台很重要,直接决定了你的工资和发展。 比如基金公司可能需要了解投资相关知识,社交公司可能要懂一些 feed 设计知识,媒体公司可能需要懂多媒体相关知识。(当然重点还是用 python 实现业务逻辑)
专业素养¶
公司做项目不是自己过家家,需要你具备写文档,注释,单元测试,沟通表达、与人协作、处理业务的能力。如果你现在还不了解一个正规python项目都有哪些组建构成,请去github克隆一份知名的代码仓库,花点时间仔细分析下它的项目结构和源代码。 比如著名网站reddit代码已经开源,大部分python实现,可以参考下。另外很多著名的python库,比如requests/flask等也可以作为参考。从笔者短暂的从业经历来看,大部分自学python的人不怎么遵守代码规范(pep8), 不知道或者不重视单元测试(写个函数print下就觉得OK了),不知道怎么写注释和文档(docstring听过吗?)。所以希望学习python的你能遵守工程实践,具备良好的职业素养和编码习惯,推荐阅读《代码大全》《编程匠艺》之类的工程相关的书。
软件工程¶
如果有时间我建议了解下软件工程相关的东西,在你没工作之前看书本的东西不会有太多体会,但是工作以后就会感受到做项目远远不是只有写代码这么简单。包括整个开发流程、进度管理、质量管理等还是有很多学问的。 这里推荐一本邹欣(现任微软Windows中国工程团队首席研发总监)的书,读起来比较接地气。
后端技术栈¶
web 后端工程师的主要工作职责是实现网站、app 业务后端逻辑(产品业务逻辑),涉及到的技术相关知识点基本就是上边列举的这些。 对于技能需求可以在拉勾上搜一下Python的职位,看看各个公司对Python的要求。或者你可以写个拉勾网的爬虫,对数据做一个简单的统计,笔者当初找工作就是这么干的。找工作之前最好研究下期望公司的业务和使用的技术栈,有针对性学习。 另外,真正做项目还需要你熟悉python的各种库和框架,比如django/flask/tornado/requests/sqlalchemy/unittest/celery等等,掌握了合适的工具才能快速上手做东西,公司恨不得你第一天入职第二天就能写项目。 所以,在你入了门以后请尽快熟悉python web的技术栈。公司不管你会什么算法,只在乎你的生产力(有时候技术本身不重要,它的价值在于对业务、用户、顾客的贡献)。 推荐一些文章供参考:
学习路线¶
看了这么多是不是还有点懵,笔者当时自学的时候也没人带,没什么方向,走了很多弯路,找工作也不是一帆风顺。如果不是科班出身受过系统的计算机科学理论的训练,是比较吃亏的,只能通过大量针对性学习和练习来弥补。 大概整理下自己学习 python web 的路线,方便大家做个参考(一个合格的工程师不是短时间能练成的)。其实这基本上也是后端工程师的学习路线,换一个编程语言或者框架都差不多。技术更新迭代非常快,后端技术还算比较稳定的,但是知识点很多很杂,有针对性学习比较好。 如果你觉得这个教程列出的东西太多,建议就找最重要的知识点,每个知识点挑一本最合适的书学习,我列举的很多资料对于初学者来说可能短时间内难以消化,会有畏难心理和学习焦虑,建议多加练习通过正反馈提升自己学习的乐趣。(如果你还是个学生那很好,有大把的时间准备)
学习并熟练掌握一门编程语言(学好英语)。这里笔者选择的是最近特别火的 python,它能干很多事。挑一本好的入门教材,通读并实践书中所有代码示例和练习题(练手感,坚持敲,大量敲)。了解该语言如何操作文本、进程、网络编程等,最后达到能熟练运用编程语言表达逻辑的能力。
搭建好开发环境。初学者个人比较推荐 Ubuntu 系统 + Pycharm 社区版,都是可以免费获取的,我经常安利用 linux 或者 mac,和桌面端不同,企业大部分用的都是 linux server 部署 web 应用的(包括 docker 容器技术等都是基于 linux),熟悉 linux 命令行、文件、进程操作等会给你找工作和日常工作带来便利。
熟悉算法和数据结构。对于编程语言内置的数据结构、算法等要数量掌握和使用,常用数据结构和算法了解其原理,会计算时间空间复杂度,会自己实现(常见算法面试笔试常考)。
熟悉网络协议 TCP/IP,HTTP,了解互联网是怎么运作的。既然是做网站,需要对网络运行原理比较了解。
学习 web 框架和 python 库。做东西我们需要大量现成的轮子帮助我们,看下 django、flask 等流行的 tutorial,然后做个简单的网站出来(比如博客网站,一般按照教程撸一遍就入门了,python web 框架的文档非常完善)。最好能深入一个框架了解原理,比如看看 flask 和 Werkzeug 源码。
了解前端知识。如果能独立做一个博客出来,大概对 html、css、js 就有所了解了。虽然是做后端,但是基本的前端知识也是必不可少的。
学习业务常用数据库 mysql 和 redis,业界用得比较多的数据库。了解关系型数据库 mysql 基础概念、语句、索引优化等,了解内存型数据库 redis 的常用数据结构,使用场景、结构设计等。
学习 git 版本控制。公司项目协作的时候都是有版本控制的,方便我们协作、记录、回滚代码等。学习编码规范,培养良好的编程习惯。我建议一开始就遵守 pep8,用好 autopep8,pylint 等工具,写出格式规范的代码,不要走野路子。(学习下文档和规范很棒的 python 开源代码)
在 linux server 部署你的 python web 服务。你需要学习 linux 常用命令,web 服务器 nginx 等。最好能独立部署一个网站出来。(笔者经常安利 linux 或者 mac,即使不用来作为开发环境,也要熟悉 linux 命令,能帮助你在服务器上快速修改和调试代码)
对照招聘网站中意的公司的招聘需求查漏补缺。初期就是要多学多练多 google,不是做项目就是在刷题。可以做一些博客、论坛、管理后台等小网站练手。
老实说相比 java 和 php,python 后端岗位是比较少的,如果你学完了还没找到工作然后来臭骂我一顿我会感觉委屈的。我个人倾向于 python 是因为真爱,并且学习python 性价比很高,可以做很多事。如果你觉得不好找工作或者只是把 python 当玩具玩(比如用 pandas 分析自己的投资收益,回测等),换个语言和技术栈后端路线图基本上还是这些,不会白学的。
建议坚持写技术博客,学习笔记等,总结输出(比如所谓的费曼学习法就是强调你要把学到的讲给别人听才是真正理解了)。你可以使用 hexo 之类的静态博客,或者知乎专栏等现成的服务,或者 readthedoc、gitbook 之类的文档工具。好的技术博客是找工作的一大加分项,笔者工作以后依然坚持写博客记录日常所学,可以是读书笔记、学习心得、对某个技术的理解和实践、甚至是备忘录等。
进阶建议:看《Fluent Python》 之类的进阶书籍;看优秀的源码,比如 python 一些内置库,flask 等优秀的框架源码(可以用 gitx 之类的工具从代码的最初提交开始看起),能学到很多惯用法和稍微底层一些的东西。尝试仿写,比如实现个简单的 web 小框架,大概就了解框架的运行原理了。
求职与面试¶
之前求职的时候每次面试都会充分准备(自己挂过很多次),提前一个月左右开始回顾重点理论知识(看面试相关的书),刷常用算法,练习手写代码,看相对岗位的招聘需求等。最近面试就发现很多面试者无论是否是有经验都准备不足,忽略了基础知识。 如果没有知名公司或者项目相关背景,很多招聘要求比较高的公司都会比较看重理论基础和学习能力。公司最好能有一份针对初级、中级、高级岗位的题目,尽量覆盖面广泛、难度适中,防止因为面试官的个人喜好影响面试结果。
我建议你闲着没事的时候可以多看看招聘信息,熟悉各个公司对当前技术栈的要求,看看自己和意向公司差距在哪,查漏补缺
电子简历尽量用 pdf 格式,方便跨平台打开。doc 等格式在不同的电脑上打开会有排版问题,很多后端技术面试官可能使用的是 mac 或者 linux。
提前复习回顾重点知识,防止卡在基础上。比如 mac 下著名的 brew 工具作者面试 google 就因为没写出来反转二叉树被拒,后来去了苹果😂.(这就只能看人品和运气和眼缘了,如果没见到二面面试官或者 hr,大概率是挂了)。(树、链表、哈希表、二分、快排、TCP/UDP、HTTP、数据库ACID、索引优化等常考点)。
白板编程,练习在纸上手写代码。虽然很多求职者都很抵触手写代码,但是白板编程确实是一种比较好的区分方式。你的思考过程、编码习惯、编码规范等都能看出来。
如果被问到工程里不会使用但是比较刁钻的算法题,建议你和面试官沟通的时候问问这个算法或者题目在开发中有哪些实际使用场景,看看对方怎么说😎。
面试的时候准备充分,简历要与招聘方需求对等。笔者每次面试都会带上白纸、笔、简历、电脑等,即使面试没过,至少也让面试官感觉我是有诚意的,给对方留下好印象。
加分项:github、个人技术博客、开源项目、技术论坛帐号等,让面试官有更多渠道了解你,有时候仅仅根据几十分钟的面试来评判面试者是有失偏颇的。(比如面试者临场发挥不好;面试官个人偏好;会的都不问,问的都不会等)
面试之前可以适当刷题,这几年招聘难度越来越大, 很多互联网公司都会问一些 leetcode 上的题目,如果不准备很有可能当场写不出来
《interview_python》 python 面试题
《程序员面试金典》 程序员面试,很多公司会比较重视基础知识
系统/架构设计进阶¶
对于有经验的工程师来说,系统设计也是一项重要的能力(也是除了存储系统、程序设计、网络通讯、操作系统之外经常被面试考到的)。比如设计一个短网址服务、简单的 feed 流系统、推荐系统、发号器服务等。笔者也处于学习中,推荐个资料供参考: (其实中高级后端涉及的其他东西还挺多的,系统设计、大数据存储、消息队列、分布式、缓存、并发优化、软件工程等)
Web 开发常用 Python 库(Golang 常用库请参考 golang 章节)¶
列举平常开发常用的一些库和框架(你可以很容易 google 到它们的用法),你不必一开始就掌握它们,但需要的时候了解它们的用法会大大提升你的开发效率, 在开发工具章节我还会列举到更多能够提升开发效率的工具。
web/restful 框架:Django/Flask/Tornado
异步http web框架:FastApi/aiohttp/Sanic
ORM: sqlalchemy, Peewee
表单验证:WTForms, marshmallow
数据处理和分析:Numpy, Pandas, Matplotlib
异步:celery, asyncio, tornado
并发:gevent, threading, concurrent.futures
部署:uwsgi, gunicorn(推荐)
html 处理: lxml, beautifulsoup
爬虫:requests, Scrapy
单元测试:unittest, nose, pytest(推荐)
图片处理:pillow
python2/3 兼容:six, 2to3
代码检测:autopep8, pylint, flake8, mypy(python3)
调试:Ipython, Ipdb, pdbpp
终端:rich(美化颜色输出)
命令行:click
打包:Nuitka
任务队列:apscheduler, huey
裁员、劳动法与法律援助¶
最近几年裁员事件逐渐增多,互联网 ToC 端增长见顶,很多收益不好的公司或者创业公司效益不行。 作为一个码农,要适当了解法律常识,学会维护自己的合法权益。