是一種人工智能模型,可以讓我們與計(jì)算機(jī)進(jìn)行對(duì)話,就像與一個(gè)智能伙伴聊天一樣。它通過學(xué)習(xí)大量的對(duì)話數(shù)據(jù)和語言知識(shí),能夠理解我們的問題,并生成有意義的回答。

可以理解并生成代碼chatgpt 編程實(shí)例,那么自然而然,它的作用不僅僅是幫助學(xué)習(xí)代碼,同樣也可以直接用在實(shí)際的軟件開發(fā)當(dāng)中。

對(duì)于網(wǎng)頁上的數(shù)據(jù)采集及處理是的常見應(yīng)用場(chǎng)景之一。我們來看下是不是也能完成這樣的任務(wù)。

假設(shè)我們現(xiàn)在需要抓取并整理某個(gè)網(wǎng)頁上的表格數(shù)據(jù):

chatgpt 編程實(shí)例_數(shù)據(jù)采集的程序_數(shù)據(jù)采集用什么語言編程

我們直接來問問chatgpt 編程實(shí)例,能不能給個(gè)抓取的代碼:

數(shù)據(jù)采集的程序_chatgpt 編程實(shí)例_數(shù)據(jù)采集用什么語言編程

給了我們一份代碼,但很遺憾,把這個(gè)代碼復(fù)制到編輯器中運(yùn)行后,生成的是空的。

簡單調(diào)試后發(fā)現(xiàn),原來是因?yàn)轫撁嫔系谋眍^元素用的是標(biāo)簽

數(shù)據(jù)采集用什么語言編程_數(shù)據(jù)采集的程序_chatgpt 編程實(shí)例

而因?yàn)闆]有獲知具體的頁面代碼信息,直接當(dāng)做標(biāo)簽來處理,所以沒采集到表頭信息。

數(shù)據(jù)采集的程序_數(shù)據(jù)采集用什么語言編程_chatgpt 編程實(shí)例

這種情況下,我們可以手動(dòng)對(duì)代碼做一些修改。

或者,我們點(diǎn)擊回答下方的“ ”,讓它重新回答一次試試:

數(shù)據(jù)采集的程序_數(shù)據(jù)采集用什么語言編程_chatgpt 編程實(shí)例

這次給出的代碼比之前簡潔:

import pandas as pd
# 讀取網(wǎng)頁上的表格url = 'https://python666.cn/static/score.html'tables = pd.read_html(url)
# 假設(shè)目標(biāo)表格是第一個(gè)表格table = tables[0]
# 將表格保存為Excel文件output_file = 'table.xlsx'table.to_excel(output_file, index=False)
print(f"表格已保存為 {output_file}")

運(yùn)行后,成功得到了我們要的結(jié)果:

chatgpt 編程實(shí)例_數(shù)據(jù)采集用什么語言編程_數(shù)據(jù)采集的程序

順利拿到數(shù)據(jù)后,我們?cè)龠M(jìn)一步,讓來對(duì)數(shù)據(jù)進(jìn)行排序。當(dāng)然,在排序前chatgpt 編程實(shí)例,我們需要告訴它關(guān)于表格內(nèi)容的必要信息:

數(shù)據(jù)采集用什么語言編程_數(shù)據(jù)采集的程序_chatgpt 編程實(shí)例

代碼:

import pandas as pd
# 讀取網(wǎng)頁上的表格url = 'https://python666.cn/static/score.html'tables = pd.read_html(url)
# 假設(shè)目標(biāo)表格是第一個(gè)表格table = tables[0]
# 將缺失值替換為0table.fillna(0, inplace=True)
# 計(jì)算每個(gè)學(xué)生的均分table['均分'] = table.mean(axis=1)
# 按均分降序排序table.sort_values(by='均分', ascending=False, inplace=True)
# 將表格保存為Excel文件output_file = 'sorted_table.xlsx'table.to_excel(output_file, index=False)
print(f"按均分排序后的表格已保存為?{output_file}")

這次,完美實(shí)現(xiàn)了我們提出的需求:

數(shù)據(jù)采集用什么語言編程_數(shù)據(jù)采集的程序_chatgpt 編程實(shí)例

可以看出,雖然很強(qiáng)大,但并不能保證每次生成的代碼都是完美,仍然可能需要引導(dǎo)它修正或人工干預(yù)。

但即便如此,它也已經(jīng)算得上一個(gè)十分得力的編程助手,可以大大提高開發(fā)效率。尤其像數(shù)據(jù)處理這種場(chǎng)景,以往開發(fā)時(shí)常常需要查找各種函數(shù)及其參數(shù)的使用方法。現(xiàn)在有了,只要準(zhǔn)確描述數(shù)據(jù)格式及需求,就可以立刻得到相應(yīng)的處理代碼,非常的方便。

我現(xiàn)在做數(shù)據(jù)分析已經(jīng)快離不開它了。

在的新書《碼上行動(dòng):零基礎(chǔ)學(xué)會(huì)編程(版)》中也講解了類似利用進(jìn)行輔助開發(fā)的案例。

本書力求做到淺顯易懂,讓完全沒有編程經(jīng)驗(yàn)的零基礎(chǔ)“小白”也能學(xué)會(huì)。內(nèi)容從環(huán)境搭建這種最基礎(chǔ)的步驟開始講起,逐漸深入到常見的實(shí)際應(yīng)用當(dāng)中。在講解知識(shí)點(diǎn)的同時(shí)配有相應(yīng)的代碼示例,讓讀者可以邊學(xué)邊練加深理解。

全書涵蓋環(huán)境搭建、基礎(chǔ)語法、常見數(shù)據(jù)類型、實(shí)用模塊、正則表達(dá)式、面向?qū)ο缶幊獭⒍嗳蝿?wù)編程等知識(shí)點(diǎn)。另外還提供了爬蟲、GUI、游戲三個(gè)實(shí)戰(zhàn)項(xiàng)目。

書中還創(chuàng)新地使用作為編程學(xué)習(xí)的輔助,帶領(lǐng)讀者探索AI時(shí)代下學(xué)習(xí)編程的新模式。

chatgpt 編程實(shí)例_數(shù)據(jù)采集用什么語言編程_數(shù)據(jù)采集的程序

點(diǎn)擊領(lǐng)取京東紅包

免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點(diǎn)和立場(chǎng)和對(duì)其真實(shí)性負(fù)責(zé)。如需轉(zhuǎn)載,請(qǐng)聯(lián)系原作者。如果來源標(biāo)注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。