一般來講對(duì)我們而言,需要抓取的是某個(gè)網(wǎng)站或者某個(gè)應(yīng)用的內(nèi)容,提取有用的價(jià)值。內(nèi)容一般分為三部分,結(jié)構(gòu)化的數(shù)據(jù)、半結(jié)構(gòu)化的數(shù)據(jù)和非機(jī)構(gòu)化數(shù)據(jù)。 1.結(jié)構(gòu)化數(shù)據(jù): 可以用統(tǒng)一的結(jié)構(gòu)加以表示的數(shù)據(jù)??梢允褂藐P(guān)系型數(shù)據(jù)庫表示和存儲(chǔ),表現(xiàn)為二維形式的數(shù)據(jù),一般特點(diǎn)是:數(shù)據(jù)以行為單位,一行數(shù)據(jù)表示一個(gè)實(shí)體的信息,每...
www.dbjr.com.cn/article/2084...htm 2025-6-3