+ removed some obsolete variables
authorfabio <fabio@e1793c9e-67f9-0310-80fc-b846ff1f7b36>
Wed, 5 Mar 2008 16:10:31 +0000 (16:10 +0000)
committerfabio <fabio@e1793c9e-67f9-0310-80fc-b846ff1f7b36>
Wed, 5 Mar 2008 16:10:31 +0000 (16:10 +0000)
git-svn-id: http://svn.tuebingen.mpg.de/ag-raetsch/projects/QPalma@8042 e1793c9e-67f9-0310-80fc-b846ff1f7b36

qpalma/Configuration.py

index 201f122..12a5a51 100644 (file)
@@ -6,9 +6,7 @@ import os.path
 import cPickle
 
 ###############################################################################
-#
 # Load a random but fixed initial parameter vector this makes debugging easier
-#
 ###############################################################################
 
 fixedParamQ = cPickle.load(open('/fml/ag-raetsch/home/fabio/svn/projects/QPalma/scripts/randInitParam.pickle'))
@@ -17,14 +15,14 @@ fixedParamQ = cPickle.load(open('/fml/ag-raetsch/home/fabio/svn/projects/QPalma/
 #
 # The parameters for the QPalma algorithm
 #
+#min_intron_len = 20
+#max_intron_len = 2000
 #
-C = 100
-
-min_intron_len = 10
-max_intron_len = 5000
-
-min_svm_score = 0.0 
-max_svm_score = 1.0
+#min_svm_score = 0.0 
+#max_svm_score = 1.0
+#
+#min_qual = -5
+#max_qual = 40
 
 numConstraintsPerRound = 50
 
@@ -44,9 +42,7 @@ mode = 'using_quality_scores'
 # 
 # When using quality scores our scoring function is defined as
 #
-# f: S_e x R x S -> R
-#
-# where S_e is {A,C,G,T,N} and S = {A,C,G,T,N,-}
+# f: S_e x R x S -> R, where S_e is {A,C,G,T,N} and S = {A,C,G,T,N,-}
 # 
 # as opposed to a usage without quality scores when we only have
 # 
@@ -58,7 +54,6 @@ mode = 'using_quality_scores'
 #  -------------------------  
 #  idx  |   0  1  2  3  4  5
 #   
-# 
 #              dna
 #
 #           -  a  c  g  t  n
@@ -69,35 +64,18 @@ mode = 'using_quality_scores'
 #        n
 #  
 # so the index can be calculated as (estnum-1)*6 + dnanum.
-#
-# At ests we do not have gaps with quality scores so we look up the matchmatrix
+# Ests do not have gaps with quality scores so we look up the matchmatrix
 # instead.
 ###############################################################################
 
 read_size = 36
-
 extension = (250,500)
 
-#numLengthSuppPoints  = 30 
-#numDonSuppPoints     = 30
-#numAccSuppPoints     = 30
-#numQualSuppPoints    = 16
-
-#numLengthSuppPoints  = 20 
-#numDonSuppPoints     = 20
-#numAccSuppPoints     = 20
-#numQualSuppPoints    =  8
-
 numLengthSuppPoints  = 10
-numDonSuppPoints     = 2
-numAccSuppPoints     = 2
+numDonSuppPoints     = 10
+numAccSuppPoints     = 10
 numQualSuppPoints    = 10
 
-min_qual = -5
-max_qual = 40
-
-USE_OPT = True
-
 if mode == 'normal':
    sizeMatchmatrix   = (6,6)
    estPlifs = 0
@@ -111,17 +89,10 @@ elif mode == 'using_quality_scores':
 else:
    assert False, 'Wrong operation mode specified'
 
-totalQualSuppPoints = numQualPlifs*numQualSuppPoints
-
-numFeatures = numDonSuppPoints + numAccSuppPoints\
-+ numLengthSuppPoints + sizeMatchmatrix[0]*sizeMatchmatrix[1] + totalQualSuppPoints 
-
 ###############################################################################
 #
 # GENERAL SETTINGS CONCERNING THE SOLVER
 #
-#
-#
 ###############################################################################
 
 iter_steps = 40
@@ -130,9 +101,9 @@ print_matrix            = False
 anzpath                 = 2
 
 if mode == 'normal':
-   fixedParam = fixedParamQ[:numFeatures]
+   fixedParam = fixedParamQ
 elif mode == 'using_quality_scores':
-   fixedParam = fixedParamQ[:numFeatures]
+   fixedParam = fixedParamQ
 else:
    assert False, 'Wrong operation mode specified'
 
@@ -140,13 +111,11 @@ else:
 #
 # DATA SETTINGS CONCERNING THE SPLITS AND FILE LOCATIONS
 #
-#
-#
 ###############################################################################
 training_begin    =  0
-training_end      =  10000
+training_end      =  5000
 
-prediction_begin  =  10000
+prediction_begin  =  5000
 prediction_end    =  20000
 
 joinp = os.path.join
@@ -159,28 +128,20 @@ annot_path     = joinp(data_path,'annotation_data')
 remapped_path  = joinp(data_path,'remapped_solexa_data')
 
 dna_flat_fn    =  '/fml/ag-raetsch/share/projects/genomes/A_thaliana_best/genome/'
-gff_fn         = joinp(annot_path,'TAIR7_GFF3_genes_Chr%s.gff_v1')
-#filtered_fn    = joinp(data_path,'allFilteredReads_07_02_2008')
-filtered_fn    = joinp(data_path,'filteredReads_test')
-remapped_fn    = joinp(remapped_path,'map_best_hit.18.unambig')
 
-dataset_fn = '/fml/ag-raetsch/home/fabio/svn/projects/QPalma/scripts/chr1_dataset.pickle'
+gff_fn         = joinp(annot_path,'TAIR7_GFF3_genes_Chr%s.gff_v1')
 
 ###############################################################################
 #
 # SANITY CHECKS
 #
 ###############################################################################
-assert numQualPlifs       >= 0
-assert numDonSuppPoints    > 1
-assert numAccSuppPoints    > 1
-assert numLengthSuppPoints > 1 
-assert numQualSuppPoints   > 1
-
+#assert numQualPlifs       >= 0
+#assert numDonSuppPoints    > 1
+#assert numAccSuppPoints    > 1
+#assert numLengthSuppPoints > 1 
+#assert numQualSuppPoints   > 1
 assert os.path.exists(dna_flat_fn), 'DNA data does not exist!'
-assert os.path.exists(filtered_fn), 'EST/Reads data does not exist!'
-assert os.path.exists(remapped_fn), 'EST/Reads data does not exist!'
 
 extended_alphabet = ['-','a','c','g','t','n','[',']']
 alphabet          = ['-','a','c','g','t','n']
-