mcroos2
CS598DL4H

Repository

@article{oleynik2019evaluating,
  title={Evaluating shallow and deep learning strategies for the 2018 n2c2 shared-task on clinical text classification},
  author={Michel Oleynik and Amila Kugic and Zdenko Kasáč and Markus Kreuzthaler},
  journal={Journal of the American Medical Informatics Association},
  publisher={Oxford University Press},
  year={2019}
}
cd existing_repo
git remote add origin https://gitlab.engr.illinois.edu/mcroos21/cs598dl4h.git
git branch -M main
git push -uf origin main
mcroos@INDRAN-I6700K:~/code/aih/aih_project/data
$ ls
bio_embedding_extrinsic.bin  n2c2-fasttext.bin  n2c2-fasttext.vec  n2c2-t1_gold_standard_test_data.zip  sentences.txt  test  train  train.zip  vectors.tsv  vectors.vec  vocab.txt
mcroos@INDRAN-I6700K:~/code/aih/aih_project/data
$ /home/mcroos/code/aih/fastText/fasttext skipgram -input sentences.txt -output n2c2-fasttext -dim 200 -t 0.001 -minCount 0 -neg 10 -wordNgrams 6 -ws 20
Read 0M words
Number of words:  23331
Number of labels: 0
Progress: 100.0% words/sec/thread:   10178 lr:  0.000000 avg.loss:  2.029469 ETA:   0h 0m 0s
mcroos@INDRAN-I6700K:~/code/aih/aih_project/data
$ ../n2c2/scripts/print_vectors.sh n2c2-fasttext.bin
(base)
mcroos@INDRAN-I6700K:~/code/aih/aih_project/data
$ ls
bio_embedding_extrinsic.bin  n2c2-fasttext.bin  n2c2-fasttext.vec  n2c2-t1_gold_standard_test_data.zip  sentences.txt  test  train  train.zip  vectors.tsv  vectors.vec  vocab.txt
mcroos@INDRAN-I6700K:~/code/aih/aih_project
$ /usr/lib/jvm/java-11-openjdk-amd64/bin/java  at.medunigraz.imi.bst.n2c2.ClassifierRunner
22:00:32  INFO [DatasetUtil         ] Loading 202 files from /home/mcroos/code/aih/aih_project/data/train ...
22:00:32 DEBUG [DatasetUtil         ] Reading /home/mcroos/code/aih/aih_project/data/train/255.xml
22:00:32 DEBUG [DatasetUtil         ] Reading /home/mcroos/code/aih/aih_project/data/train/332.xml
22:00:32 DEBUG [DatasetUtil         ] Reading /home/mcroos/code/aih/aih_project/data/train/315.xml
22:00:32 DEBUG [DatasetUtil         ] Reading /home/mcroos/code/aih/aih_project/data/train/210.xml