Spaces:

Knowles-Lab
/

tiger

Running on CPU Upgrade

Andrew Stirn commited on Jan 5, 2023

Commit

5fc4e72

1 Parent(s): 2694c1b

use zipped fasta file

Files changed (1) hide show

tiger.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 import numpy as np
 import pandas as pd
 import tensorflow as tf
@@ -85,7 +86,7 @@ def tiger_predict(transcript_seq: str):
 def find_off_targets(guides, batch_size=1000):
-    with open('gencode.v19.pc_transcripts.fa', 'r') as file:
         df_transcripts = pd.DataFrame([(t.id, str(t.seq)) for t in SeqIO.parse(file, 'fasta')], columns=['id', 'seq'])
     df_transcripts['id'] = df_transcripts['id'].apply(lambda s: s.split('|')[4])
     df_transcripts.set_index('id', inplace=True)

 import os
+import gzip
 import numpy as np
 import pandas as pd
 import tensorflow as tf
 def find_off_targets(guides, batch_size=1000):
+    with gzip.open(os.path.join('transcripts', 'gencode.v19.pc_transcripts.fa.gz'), 'rt') as file:
         df_transcripts = pd.DataFrame([(t.id, str(t.seq)) for t in SeqIO.parse(file, 'fasta')], columns=['id', 'seq'])
     df_transcripts['id'] = df_transcripts['id'].apply(lambda s: s.split('|')[4])
     df_transcripts.set_index('id', inplace=True)