大容量csv快速內(nèi)導(dǎo)入sqlserver的解決方法(推薦)
前言
在論壇中回答了一個(gè)問題,導(dǎo)入csv 數(shù)據(jù),并對(duì)導(dǎo)入的數(shù)據(jù)增加一個(gè)新的列date datetime。要求在10s內(nèi)完成,200w行數(shù)據(jù)的導(dǎo)入.分享下解決問題的思路和方法
分析
通常來講Bulk insert 比 BCP 更快一點(diǎn),我們選擇Bulk insert的方式。 提出的解決方案:先把數(shù)據(jù)導(dǎo)入到sql server 的臨時(shí)表,然后再插入目標(biāo)表。 具體語句如下:
bulk insert test07232 from 'D:\2017-7-22.csv' WITH ( FIELDTERMINATOR = ',', ROWTERMINATOR = '/n' ) SELECT * ,GETDATE() AS Date INTO ttt FROM test07232
但是他提供的的csv 進(jìn)行導(dǎo)入時(shí),提示如下錯(cuò)誤
消息 4866,級(jí)別 16,狀態(tài) 1,第 1 行 大容量加載失敗。數(shù)據(jù)文件中第 1 行的第 2 列太長(zhǎng)。請(qǐng)驗(yàn)證是否正確指定了字段終止符和行終止符。 消息 7399,級(jí)別 16,狀態(tài) 1,第 1 行 鏈接服務(wù)器 "(null)" 的 OLE DB 訪問接口 "BULK" 報(bào)錯(cuò)。提供程序未給出有關(guān)錯(cuò)誤的任何信息。
消息 7330,級(jí)別 16,狀態(tài) 2,第 1 行 無法從鏈接服務(wù)器 "(null)" 的 OLE DB 訪問接口"BULK"提取行。
這是由于行終止符無法識(shí)別導(dǎo)致的。使用notepad++打開csv文件,在視圖中選擇顯示行尾號(hào)。
可以看到文件的換行符是LF
而對(duì)于正常的csv問題 默認(rèn)是用CRLF作為換行符的
因此上面的bulk insert 語句無法正常執(zhí)行。
解決
1.首先想到的是修改數(shù)據(jù)源頭,讓源頭產(chǎn)生正常的數(shù)據(jù),但是源頭數(shù)據(jù)不好修改 2.用程序,寫c#處理,,太費(fèi)時(shí)間 3.最后終于找到了正確的辦法
bulk insert test07232 from 'D:\2017-7-22.csv' WITH ( FIELDTERMINATOR = ',', ROWTERMINATOR = '0x0a' ) SELECT * ,GETDATE() AS Date INTO ttt FROM test07232
最后全部都在SSD 上,導(dǎo)入用時(shí)2s。生產(chǎn)正式表1s 。整個(gè)過程3s完成。
總結(jié)
解決問題要從各個(gè)問題入手,找到原因才更好的解決問題
總結(jié)
以上所述是小編給大家介紹的大容量csv快速內(nèi)導(dǎo)入sqlserver的解決方法,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
SQLServer 優(yōu)化SQL語句 in 和not in的替代方案
用IN寫出來的SQL的優(yōu)點(diǎn)是比較容易寫及清晰易懂,這比較適合現(xiàn)代軟件開發(fā)的風(fēng)格。2010-04-04mssql中得到當(dāng)天數(shù)據(jù)的語句
mssql中得到當(dāng)天數(shù)據(jù)的語句...2007-08-08在SQL Server的try...catch語句中獲取錯(cuò)誤消息代碼的的語句
本文為大家詳細(xì)介紹下如何在SQL Server的try...catch語句中獲取錯(cuò)誤消息的代碼,具體示例如下,感興趣的朋友可以參考下哈,希望對(duì)大家有所幫助2013-07-07mssql server 存儲(chǔ)過程里,bulk insert table from ''路徑+文件'',路徑固定,文件名
mssql server 存儲(chǔ)過程里,bulk insert table from ''路徑+文件'',路徑固定,文件名不固定的實(shí)現(xiàn)方法...2007-07-07SQL語句查詢數(shù)據(jù)庫中重復(fù)記錄的個(gè)數(shù)
一個(gè)sql語句:一個(gè)表test有四個(gè)字段id,a,b,c,如果表中的記錄有三個(gè)字段a,b,c都相等,則說明這條記錄是相同的,求相同的記錄的個(gè)數(shù) 。2009-11-11