пишу в zeppeline notebook
у меня есть такой dataframe:
splited_genres_df.show(20)
+-------+--------------------+---------+
|movieId| title| genres|
+-------+--------------------+---------+
| 1| Toy Story (1995)|Adventure|
| 1| Toy Story (1995)|Animation|
| 1| Toy Story (1995)| Children|
| 1| Toy Story (1995)| Comedy|
| 1| Toy Story (1995)| Fantasy|
| 2| Jumanji (1995)|Adventure|
| 2| Jumanji (1995)| Children|
| 2| Jumanji (1995)| Fantasy|
| 3|Grumpier Old Men ...| Comedy|
| 3|Grumpier Old Men ...| Romance|
| 4|Waiting to Exhale...| Comedy|
| 4|Waiting to Exhale...| Drama|
| 4|Waiting to Exhale...| Romance|
| 5|Father of the Bri...| Comedy|
| 6| Heat (1995)| Action|
| 6| Heat (1995)| Crime|
| 6| Heat (1995)| Thriller|
| 7| Sabrina (1995)| Comedy|
| 7| Sabrina (1995)| Romance|
| 8| Tom and Huck (1995)|Adventure|
+-------+--------------------+---------+
only showing top 20 rows
в столбце title есть и название фильма и год выпуска этого фильма, а мне нужно этот год добавить в отдельный столбец под названием year а title видоизменить, чтобы он был без года, а только название фильма.