pyspark.sql.DataFrame.distinct¶

DataFrame.distinct()[source]¶

Returns a new DataFrame containing the distinct rows in this DataFrame.

>>> df.distinct().count()
2

New in version 1.3.

pyspark.sql.DataFrame.describe pyspark.sql.DataFrame.drop