Spaces:

awacke1
/

SaveAndReloadDataset

Runtime error

awacke1 commited on May 26, 2022

Commit

6cc96bf

1 Parent(s): 973de77

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,24 +2,11 @@
 from datasets import load_dataset
 raw_datasets = load_dataset("allocine")
 raw_datasets.save_to_disk("my-arrow-datasets")
 # load dataset from disk - prove we can reload it
 from datasets import load_from_disk
 arrow_datasets_reloaded = load_from_disk("my-arrow-datasets")
 arrow_datasets_reloaded
-# prove we can save and load public local dataset on huggingface spaces
-raw_datasets.save_to_disk("awacke1/my-arrow-datasets")
-arrow_datasets_reloaded = load_from_disk("awacke1/my-arrow-datasets")
-awacke1_public_datasets = load_dataset("awacke1/my-arrow-datasets")
-awacke1_public_datasets
-#raw_datasets = load_dataset("my-arrow-datasets")
-#raw_datasets.cache_files
-#from datasets import load_dataset
-#dataset = load_dataset("awacke1/my-arrow-datasets")
 # prove we can save in CSV
 for split, dataset in raw_datasets.items():
   dataset.to_csv(f"my-dataset-{split}.csv", index=None)
@@ -52,4 +39,13 @@ parquet_data_files = {
   "test": "my-dataset-test.parquet",
 }
 parquet_datasets_reloaded = load_dataset("parquet", data_files=parquet_data_files)
-parquet_datasets_reloaded

 from datasets import load_dataset
 raw_datasets = load_dataset("allocine")
 raw_datasets.save_to_disk("my-arrow-datasets")
 # load dataset from disk - prove we can reload it
 from datasets import load_from_disk
 arrow_datasets_reloaded = load_from_disk("my-arrow-datasets")
 arrow_datasets_reloaded
 # prove we can save in CSV
 for split, dataset in raw_datasets.items():
   dataset.to_csv(f"my-dataset-{split}.csv", index=None)
   "test": "my-dataset-test.parquet",
 }
 parquet_datasets_reloaded = load_dataset("parquet", data_files=parquet_data_files)
+parquet_datasets_reloaded
+# prove we can save and load public local dataset on huggingface spaces
+raw_datasets.save_to_disk("awacke1/my-arrow-datasets")
+arrow_datasets_reloaded = load_from_disk("awacke1/my-arrow-datasets")
+awacke1_public_datasets = load_dataset("awacke1/my-arrow-datasets")
+awacke1_public_datasets