Jupyter Notebook如何導入python文件時的問題
Jupyter Notebook導入python文件時問題
如果你發(fā)現在同目錄下的ipynb文件導入py文件總是告訴你,模塊不存在,模塊找不到,那你就重新創(chuàng)建一個ipynb文件,新的,和之前那個一毛一樣就可以,大不了重新啟動一下Jupyter Notebook然后你就會發(fā)現是你的電腦在逗你玩
上圖:
如圖所示,apha101和DataProcessor.ipynb,進入到DataProcessor.ipynb,新建一個cell
這是無論如何都找不到的apha101,它是想C位出道嗎?!
接著我們進入到剛剛新建的test.ipynb中,神奇吧,神奇~~~~~~~~~~~~~~~~
使用Jupyter Notebook導入csv數據時的錯誤
問題描述
前兩天學了幾個機器學習的模型,今天想拿kaggle上的數據集練練手,然后開開心心的打開jupyter,正準備一展身手時,結果剛開始導入數據集就把我整懵了。
一般我都是習慣直接那pandas的read_csv,先把文件upload到工作目錄下
代碼里直接上,先引個包,然后就開始讀,讀完好像沒啥問題,打印出來看看吧,嚯!這可把我嚇壞了
import pandas as pd data = pd.read_csv("clinvar_conflicting.csv") data
這是個啥東西?特征不像特征,標簽不像標簽的。定睛一看,好像是吧我的第一行當作列名了。
hhh然后網上各種找解決方案,又是改編碼,又是修改屬性,結果這個bug沒解決,又冒出來好多bug,比如
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd4 in position 3: invalid continuation byte,UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd4 in position 3: invalid continuation byte。。。
搞得我心態(tài)有點崩了
然后我再看看數據集,拿excel打開,完完整整,沒啥問題
拿記事本打開,emmmm。。。好像有點小問題,第五行那里為啥是dGen啥的開頭,不應該是一個數字嗎,,拉到最后一看,原來是上一行太長了,結果換行了,hh
我心里一想不對啊,我剛才那spyder是呢一遍也打開了呀,不信你看
這到底是為啥呢?然后我還仔細看了看數據,誒?好像有的數據怪怪的,比如這個應該是一個字段下的,用“”包在一起的字符串,但是字符串里有,,難道是jupyter按照字符串里的逗號分隔了??仿佛自己知道了天機,然后又是一頓操作猛如虎,各種找資料,還是解決不了。然后我又看一眼jupyter的數據,哦,好像jupyter已經解決了這個問題了,我是zz。然后我看了kaggle上其他人的代碼,人家這不是好好的嗎?難道我用了個假python???
最后氣得我直接在jupyter打開看文件,好家伙,這是啥啊,咋少了這么多數據呢???
怪不得我剛才在jupyter里上傳的時候命名30多兆的文件到這里就只剩5兆了
好吧,我明白了,是不是只要我把路徑改為絕對路徑就好使了?
蕪湖!果真,,,,終于導進來了!接下來就可以愉快的coding了!??!嗚嗚嗚嗚嗚,就這個小bug弄了一下午。
總結
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。