web-dev-qa-db-de.com

Konvertieren Sie eine einfache einzeilige Zeichenfolge in Spark in RDD

Ich habe eine einfache Zeile:

line = "Hello, world"

Ich möchte es mit nur einem Element in ein RDD konvertieren. Ich habe versucht 

sc.parallelize(line)

Aber es bekommt:

sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']

Irgendwelche Ideen? 

22
poiuytrez

versuchen Sie es mit List als Parameter: 

sc.parallelize(List(line)).collect()

es kehrt zurück 

res1: Array[String] = Array(hello,world)
26
michaeltang

Der folgende Code funktioniert gut in Python

sc.parallelize ([line]). collect ()

['Hallo Welt']

Hier übergeben wir den Parameter "line" als Liste.

0
Dhruv