Spark大数据技术与应用

Spark大数据技术与应用期末答案2023秋

1.DataFrame的哪个方法容易造成内存溢出( )A:take B:collect C:first D:show 答案:AI参考:正确选项是【A:take】\n\n在DataFrame中,take方法容易造成内存溢出,因为它直接将整个DataFrame加载到内存中,如果数据量过大,就会导致内存溢出。collect方法也会将整个DataFrame加载到内存中,但它在处理大数据时