Python数据分析崔连和课后参考答案_第1页
Python数据分析崔连和课后参考答案_第2页
Python数据分析崔连和课后参考答案_第3页
Python数据分析崔连和课后参考答案_第4页
Python数据分析崔连和课后参考答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单元一一.填空题1.数据2.数据分析3.Anoconda4.实时二.选择题1.B2.C3.D4.C三.简答题1.数据分析就是:用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。2.问题定义收集数据数据处理数据分析数据展现3、(1)代码简洁,容易理解。(2)快速开发。(3)拥有强大的通用编程能力。(4)人工智能时代的通用语言(5)方便对接其他语言单元二一.填空题1.多维数组2.m.shape3.04.numpy.dtype5.ravel()6.transpose()7.hstack()8.hsplit()9.save()10.argsort()和lexsort()二.选择题1.C2.B3.A4.B5.D6.C7.A8.B9.C10.C三.判断题1.✔2.❌3.✔4.❌5.✔6.✔7.✔8.✔9.✔10.✔四.应用题1.答:In[1]:importnumpyasnpIn[2]:np.zeros((5,5))Out[2]:array([[0.,0.,0.,0.,0.],[0.,0.,0.,0.,0.],[0.,0.,0.,0.,0.],[0.,0.,0.,0.,0.],[0.,0.,0.,0.,0.]])2.答:In[5]:np.arange(12).reshape(3,4)Out[5]:array([[0,1,2,3],[4,5,6,7],[8,9,10,11]])答:In[13]:data1=np.arange(6).reshape((2,3))+1In[14]:data2=np.arange(6).reshape((2,3))+7In[15]:data1*data2Out[15]:array([[7,16,27],[40,55,72]])In[16]:data1-data2Out[16]:array([[-6,-6,-6],[-6,-6,-6]])In[17]:data1/data2Out[17]:array([[0.14285714,0.25,0.33333333],[0.4,0.45454545,0.5]])答:In[19]:arr=np.array([[1,7,2,9,3],[4,6,5,3,6]])In[20]:arr.sort()In[21]:arrOut[21]:array([[1,2,3,7,9],[3,4,5,6,6]])单元三一.填空题1.二维2.一维3.Index4.多层5.新索引6.位置、名称7.NaN8.sort_index()9.sort_values()10.单层索引二.选择题1.ABC2.A3.B4.C5.B6.B7.D8.ABC9.A10.A三.判断题1.✔2.✔3.❌4.✔5.❌6.✔7.❌8.✔9.❌10.✔四.应用题1.答:In[1]:importpandasaspdIn[2]:data={11:100,12:200,13:300,14:400}In[3]:ser=pd.Series(data)In[4]:serOut[4]:11100122001330014400dtype:int642.答:In[5]:importnumpyasnpIn[6]:data=np.arange(16)In[8]:df=pd.DataFrame(data.reshape((4,4)),index=['a','b','c','d'],columns=['A','B','C','D'])In[9]:dfOut[9]: ABCDa0123b4567c891011d12131415答:In[11]:ser=pd.Series(range(10,20),index=range(10))In[12]:serOut[12]:010111212313414515616717818919dtype:int64In[14]:df=pd.DataFrame(np.arange(1,41).reshape(10,4))In[15]:dfOut[15]:0123012341567829101112313141516417181920521222324625262728729303132833343536937383940In[17]:df+serOut[17]:0123456789011131517NaNNaNNaNNaNNaNNaN115171921NaNNaNNaNNaNNaNNaN219212325NaNNaNNaNNaNNaNNaN323252729NaNNaNNaNNaNNaNNaN427293133NaNNaNNaNNaNNaNNaN531333537NaNNaNNaNNaNNaNNaN635373941NaNNaNNaNNaNNaNNaN739414345NaNNaNNaNNaNNaNNaN843454749NaNNaNNaNNaNNaNNaN947495153NaNNaNNaNNaNNaNNaNIn[18]:df*serOut[18]:0123456789010223652NaNNaNNaNNaNNaNNaN1506684104NaNNaNNaNNaNNaNNaN290110132156NaNNaNNaNNaNNaNNaN3130154180208NaNNaNNaNNaNNaNNaN4170198228260NaNNaNNaNNaNNaNNaN5210242276312NaNNaNNaNNaNNaNNaN6250286324364NaNNaNNaNNaNNaNNaN7290330372416NaNNaNNaNNaNNaNNaN8330374420468NaNNaNNaNNaNNaNNaN9370418468520NaNNaNNaNNaNNaNNaNIn[19]:df-serOut[19]:01234567890-9-9-9-9NaNNaNNaNNaNNaNNaN1-5-5-5-5NaNNaNNaNNaNNaNNaN2-1-1-1-1NaNNaNNaNNaNNaNNaN33333NaNNaNNaNNaNNaNNaN47777NaNNaNNaNNaNNaNNaN511111111NaNNaNNaNNaNNaNNaN615151515NaNNaNNaNNaNNaNNaN719191919NaNNaNNaNNaNNaNNaN823232323NaNNaNNaNNaNNaNNaN927272727NaNNaNNaNNaNNaNNaNIn[20]:df/serOut[20]:012345678900.10.1818180.2500000.307692NaNNaNNaNNaNNaNNaN10.50.5454550.5833330.615385NaNNaNNaNNaNNaNNaN20.90.9090910.9166670.923077NaNNaNNaNNaNNaNNaN31.31.2727271.2500001.230769NaNNaNNaNNaNNaNNaN41.71.6363641.5833331.538462NaNNaNNaNNaNNaNNaN52.12.0000001.9166671.846154NaNNaNNaNNaNNaNNaN62.52.3636362.2500002.153846NaNNaNNaNNaNNaNNaN72.92.7272732.5833332.461538NaNNaNNaNNaNNaNNaN83.33.0909092.9166672.769231NaNNaNNaNNaNNaNNaN93.73.4545453.2500003.076923NaNNaNNaNNaNNaNNaN4.答:In[26]:df=pd.Series(np.random.randn(16),index=[['a','a','a','a','b','b','b','b','c','c','c','c','d','d','d','d'],[1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4]])In[27]:dfOut[27]:a1-0.7500632-1.92586231.4673094-0.563584b1-0.8938052-1.6299903-0.08184340.007649c11.80914620.14331930.4999364-0.478171d1-1.29354020.6107563-0.36040740.575243dtype:float64单元四一.填空题1.read_csv()2.read_csv()3.xlrd4.read_json()5.read_html()二.选择题1.A2.B3.ABC单元5数据规整化一.填空题1.merge()2.不同3.行4.concat()5.轴向旋转6.层次索引7.轴向旋转8.duplicated()9.cut()10.数组二.选择题1.A2.B3.A4.B5.B6.A7.A8.A9.B10.A三.判断题1.✔2.✔3.✔4.✔5.❌6.✔7.✔8.✔9.✔10.✔四.应用题1.答:In[1]:importpandasaspdIn[2]:importnumpyasnpIn[3]:np.random.seed(1000)In[4]:df=pd.DataFrame(np.random.randn(100,4))In[7]:df[np.abs(df)>1]Out[7]:01230NaNNaNNaNNaN1NaNNaNNaNNaN2NaNNaNNaNNaN3-1.196070NaNNaNNaN4NaNNaN1.271795NaN..............95-1.0250491.615114NaN-1.17264296NaN-1.238338NaNNaN971.030095NaNNaNNaN98NaN1.962265NaNNaN99NaNNaNNaN1.268900[100rowsx4columns]2.答:In[8]:importpandasaspdIn[9]:importnumpyasnpIn[10]:ages=[8,12,67,44,30,27,19,80,15,50]In[11]:bins=[0,12,18,25,45,55,100]In[12]:categories=pd.cut(ages,bins)In[13]:categoriesOut[13]:[(0,12],(0,12],(55,100],(25,45],(25,45],(25,45],(18,25],(55,100],(12,18],(45,55]]Categories(6,interval[int64,right]):[(0,12]<(12,18]<(18,25]<(25,45]<(45,55]<(55,100]]答:In[14]:df=pd.DataFrame(np.arange(16).reshape((4,4)),index=['A1','A2','A3','A4'],columns=['B1','B2','B3','B4'])In[15]:dfOut[15]:B1B2B3B4A10123A24567A3891011A412131415答:In[16]:df1=pd.DataFrame(np.arange(25).reshape((5,5)),index=['C1','C2','C3','C4','C5'],columns=['D1','D2','D3','D4','D5'])In[17]:df1Out[17]:D1D2D3D4D5C101234C256789C31011121314C41516171819C52021222324In[18]:bine_first(df1)Out[18]:B1B2B3B4D1D2D3D4D5A10.01.02.03.0NaNNaNNaNNaNNaNA24.05.06.07.0NaNNaNNaNNaNNaNA38.09.010.011.0NaNNaNNaNNaNNaNA412.013.014.015.0NaNNaNNaNNaNNaNC1NaNNaNNaNNaN0.01.02.03.04.0C2NaNNaNNaNNaN5.06.07.08.09.0C3NaNNaNNaNNaN10.011.012.013.014.0C4NaNNaNNaNNaN15.016.017

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论