使用python一段时间,如果问下面这些问题你能明确回答吗?
如果有疑问,那就跟随笔者,通过实验来搞明白这些。
*在开始前,先明确两个概念:包、模块:
模块,等同于一个.py文件(不包括扩展名)。
包,是一个目录,此目录中的.py文件是相互关联,一般此目录中常会有__init__.py和__main__.py文件。
*本环境使用的python版本为3.6.5,运行代码都是在D:workpythonzaglib目录下
*运行环境为启动当前venv下虚拟环境
一、python程序如何运行

python程序运行流程
上图是python程序的运行流程:
源代码.py被编译成字节码(内存中PyCodeObject),然后由PVM虚拟机运行;
生成的字节码,会被保存到当前目录下的__pycache__中,命名为*.pyc(需要满足条件);
下次再执行时,会检查当前源文件与对应pyc文件时间,如果源文件被修改过,则重新生成pyc,否则直接加载字节码运行。

"""run1.py、run2.py、package1/__main__.py三个文件都是此代码"""importsysprint(__file__)#当前文件名print(__name__)#当前命名空间引用名#sys.path为搜索模块的路径列表paths=sorted(sys.path)forpinpaths: print(p)
"""import_run1.py"""importrun1print(__name__)
运行python run1.py,当面目录下没有生成__pycache__目录。
运行python import_run1.py当面目录下生成__pycache__目录,其中生成文件run1.cpython-36.pyc(36表示python为3.6版本),此即为保存的字节码文件。
import_run1.py中只有一行代码: import run1。这就是要满足的条件,run1被import,run1.py被当做公共模块,才保存其字节码文件。
二、python -m的作用
run1.py、run2.py、package1/__main__.py三个文件代码相同(参考上文)
"""run3.py"""importsysprint(__file__)print(__name__)if__name__=="__main__": paths=sorted(sys.path)forpinpaths: print(p)
"""__init__.py"""print(__file__)print(__name__)
a、python -m 模块名
是在python模块搜索路径(sys.path)中查找指定模块,并作为脚本程序执行。代码执行的作用域名字__name__为__main__。
实验:在zaglib/下,运行run1.py

python -m run1
输出第一行:D:workpythonzaglibun1.py 为print(__file__)的输出(绝对路径)
第二行为:__main__ 为print(__name__)输出
sys.path搜索路径第一行为空行,即为当前路径。

python run1.py
运行结果第一行:run1.py,为print(__file__)的输出(相对路径)
第二行为:__main__ 为print(__name__)输出
结论:运行当前位置下py文件,有无-m,效果基本一致。
实验:在zaglib/下,运行zaglib/venv/run2.py

python -m run2
输出第一行:D:workpythonzaglibvenvun2.py 为print(__file__)的输出(绝对路径)
第二行为:__main__ 为print(__name__)输出,使用-m时,能成功找到并运行。

python run2找不到文件
结论:运行在其他位置的模块,-m可以在sys.path中搜索。如果没有-m,则不会查找。
b、python -m 包名
会运行包名.__main__.py。


python -m package1
输出第一行:D:workpythonzaglibpackage1\__init__.py 为print(__file__)的输出(绝对路径);
第二行为:package1为__init__.py中print(__name__)输出;
输出第三行:D:workpythonzaglibpackage1\__main__.py 为print(__file__)的输出(绝对路径);
第四行为:__main__为__main__.py中print(__name__)输出;
从输出看出,python -m package1,先运行了package1/__init__.py,再运行了__main__.py;
而__init__.py中__name__则对应包名package1,__main__.py 的命名空间称为__main__。

python -m package1.__main__输出与上图相同
结论:除非程序在当前位置运行,否则一律加 -m。-m 会搜索sys.path路径,查找模块。
三、import的背后
"""callpackage.py"""importpackage1.run3asr3print(__name__)r3.show_msg()
"""__init__.py"""print(__file__)print(__name__)
"""run3.py"""importsysprint(__file__)print(__name__)paths=sorted(sys.path)forpinpaths: print(p)defshow_msg():print("show_msg")

import package1.run3 内部运行了package1中的__init__.py种的程序,然后运行了run3.py中的程序;
而__name__,为包名.模块名。
import语句,会顺序级联方式运行引用包的__.init__.py及其后模块。__name__是一种模块引用的命名方式。
本文设计的概念很琐碎,只有把代码实际运行过,才能真正搞清楚python中隐藏的这些知识点。如果想自己制作一个pip安装的包,这些概念是基础。