Ich habe eine einfache Zeile:
line = "Hello, world"
Ich möchte es mit nur einem Element in ein RDD konvertieren. Ich habe versucht
sc.parallelize(line)
Aber es bekommt:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
Irgendwelche Ideen?
versuchen Sie es mit List als Parameter:
sc.parallelize(List(line)).collect()
es kehrt zurück
res1: Array[String] = Array(hello,world)
Der folgende Code funktioniert gut in Python
sc.parallelize ([line]). collect ()
['Hallo Welt']
Hier übergeben wir den Parameter "line" als Liste.