DS 4300。大规模的信息存储和检索。(4小时)

介绍了数据和信息存储结构化和非结构化数据的方法。介绍了如何使用分布式存储设施构建大规模信息存储结构。探讨了数据质量保证、存储可靠性和处理大数据量的挑战。研究如何多维数据模型。实现了分布式数据库。考虑多层存储设计、存储区域网络和分布式数据存储。应用算法,包括图像遍历、散列和排序、复杂的数据存储系统。认为复杂性理论和硬度的大规模数据存储和检索。需要使用非关系、文档、键列键-值,和图形数据库和编程R, Python, c++。

先决条件:CS 3200最低级的D -;(DS 4100,最低等级的D -或DS 3000最低级的D -)

属性(s):NUpath分析/使用数据