GPT-4 的数据分析功能是数据科学的重要工具,使用GPT-4我们可以分析拿到的科研数据。
在本案例中,我们将使用GPT-4的高级数据分析功能来分析Global Tree Cover Loss数据集,并通过简单的提示词,创建可视化结果,并进行初步分析,发现科学问题。
作为一名计算机+地学交叉学科研究方向的博士生,我非常喜欢人工智能的最新进展,尤其是 GPT-4
在数据科学中,将原始数据、表格、文字转化为有意义的数据视觉效果是一项艰巨的任务,特别是对于新手程序员而言。好在随着AI的发展,借助GPT-4***高级数据分析***工具(不要被名称所迷惑),新手程序员能够以图表和地图的形式生成有意义的表示,而无需编写任何代码。
更好的是,工作代码作为生成的解决方案的一部分也相应生成,可以根据需要进行修改和调整。
在 GPT-4 聊天窗口中,单击“+”图标上传我们的csv文件。
提示 GPT4:“请给我一个该数据集中字段的概述(返回中文结果)”GPT4响应:
为了确认这些字段是正确的,我们让 GPT-4 显示数据集的前 5 行。提示GPT4:“请显示该数据集的前5行”GPT4响应:
初步探索数据集,我们首先可视化全球每年的树木覆盖损失总量。这让我们对多年来全球范围内的树木覆盖损失模式有更广泛的了解,能让我们对该csv文件有清晰的认识。
提示 GPT4:“请生成全球每年树木覆盖损失总量的条形图可视化。”
从初步分析来看,即使在当前提倡绿色环保的时代,全球树木损失量似乎仍然总体呈上升趋势。
当 GPT-4 自动创建此数据视觉对象时,它使用 Python 的 matplotlib 库并生成图像结果,如果你想知道具体的代码,可以查看代码附录:
GPT的强大还不止于此,全球总体分析很方便,它为我们提供了一些大致的思路,但我们分析的核心在于更精细的方法——了解区域模式。GPT可以进一步通过分析不同国家的树木覆盖损失,我们可以深入了解哪些地区受影响最严重。为此,我们将生成一个分组条形图,显示选定年份(2000 年、2005 年、2010 年、2015 年和 2020 年)各个地区的树木覆盖损失。
提示 GPT4:请生成 2005 年、2010 年、2015 年和 2020 年的前 10 个国家树木覆盖损失的条形图。为每个条形提供不同的颜色以显示清晰的对比。GPT-4 响应:
GPT产生的图非常美观。条形图中的一个有趣的数据点是澳大利亚 2020 年的森林损失,这是由于2020年澳大利亚的森林大火,2430 万公顷森林被烧毁。展望历史上最近的时期,我们可以更密切地关注地区。这可能需要更紧急的干预措施。为此,我们将重点关注 2020 年树木覆盖损失最严重的地区。
提示 GPT4:请生成 2020 年树木覆盖损失最高的前 10 个国家的条形图。
从图中我们可以看到,中国的森林损失相当少,这是由于中国政府采取了环境保护和绿色发展的战略,效果显著。总之,通过这组数据可视化,我们能够更全面地了解全球树木覆盖损失模式。我们已经看到了全球总体趋势,研究了区域模式,确定了最近受影响最严重的区域。进一步发现科学问题,绘制图形~
我现在每天都离不开ChatGPT~
联系客服