INDIAai数据集概览

根据Statista的数据,预计到2030年,印度的人工智能市场将以28.63%的速度增长,市场规模将达到283.6亿美元。这表明人工智能在全球范围内的迅猛发展,而印度正通过INDIAai计划积极参与其中。INDIAai是一个知识门户、研究机构和生态系统建设倡议,旨在联合和促进印度人工智能生态系统内各种实体的合作。

INDIAai提供的数据集

INDIAai提供了丰富的数据集,对于即将毕业并寻找数据科学项目的学生来说,这些数据集是不可或缺的。这些数据集覆盖了数据科学、自然语言处理、计算机视觉、健康分析和经济社会研究等多个领域,为探索和发现提供了机会。

INDIAai精选的10个数据集涵盖了多个领域和用例的数据源。这些数据集被精心策划、注释,并提供给研究人员、实践者和爱好者。无论对自然语言处理、计算机视觉、健康分析还是经济社会研究感兴趣,这些数据集都为提供了探索和发现的机会。

国际人口科学研究所(IIPS)在2019年进行了全球青少年烟草调查(GYTS-4),旨在评估13-15岁学龄儿童在不同邦和联邦地区的烟草使用情况。调查深入探讨了性别、学校位置(农村或城市)和学校管理类型(公立或私立)等人口统计因素,以提供对这一人群烟草消费模式的深入理解。

经济事务部精心编制了全面的国家财政和经济数据。这个宝贵的数据库包括外部债务、中央政府借款、月度经济报告和简洁的国家总结数据页面等关键指标,为宏观和微观层面的知情决策和战略规划提供了坚实的基础。

在数字图书馆中,可以探索从1991年到2011年的大量宝贵资源,包括人口普查表格、报告和各种数字文件。深入丰富的数据集、富有洞察力的报告和精心策划的信息,所有这些都可供无缝下载,使研究人员、政策制定者和好奇的头脑能够解锁新的见解和视角。

野生动物研究所最近推出了其开创性的野生动物植物标本数据集,包含4591个标本。这个全面的收藏包括各种动植物,经过精心编目和数字化,供科学探索。利用全球生物多样性信息设施(GBIF)网络,这些数字标本可供全球研究人员使用,为自然世界提供了无与伦比的洞察力。

由通信部、电信部和印度电信监管局(TRAI)收集的语音通话质量客户体验数据是衡量印度电信性能的重要指标。这个全面的数据集涵盖了不同地区、电信运营商和技术基础设施的语音通话质量指标。

该数据集包含了在Udyog Aadhaar备忘录下注册的中小微企业(MSMEs)的全面信息。它涵盖了这些注册单位的许多细节,从人口统计信息到运营细节。

由Panchayati Raj部提供的地方政府目录(LGD)-城市数据集是城市治理的全面资源。它包含了对有效管理和规划至关重要的广泛信息,特别关注城市管辖区的地区。

由卡内基梅隆大学语言技术研究所创建的ClueWeb09数据集对于推进信息检索和语言技术的研究至关重要。它包含了2009年初收集的10亿个网页的庞大收藏,提供了十种不同语言的多样化在线内容。

20个新闻组数据集是机器学习的基石。它包括大约20,000份来自各种新闻组的文件。这些文件被精心划分,确保在20个类别中几乎均匀分布。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485