+ extended evaluation function to return positionwise deviations
[qpalma.git] / qpalma / Configuration.py
index e7d045d..d35c6c4 100644 (file)
@@ -300,6 +300,8 @@ fixedParam = numpy.matlib.mat([[ 0.62870709], [ 0.7012026 ], [ 0.60236784],
   [ 0.69422476], [ 0.4310939 ], [ 0.03069099], [ 0.35969779], [ 0.18047331],
   [ 0.4177651 ], [ 0.01360547], [ 0.29069319]])
 
+#fixedParamQ = numpy.matlib.mat(range(1300))
+#fixedParamQ = fixedParamQ.reshape((1300,1))
 
 ###########################################################
 #
@@ -307,15 +309,24 @@ fixedParam = numpy.matlib.mat([[ 0.62870709], [ 0.7012026 ], [ 0.60236784],
 #
 #
 
-C = 10000
+C = 1
 
+###############################################################################
+# 
+# CHOOSING THE MODE 
+# 
 # 'normal' means work like Palma 'using_quality_scores' means work like Palma
 # plus using sequencing quality scores
+#
+###############################################################################
 
 #mode = 'normal'
-
 mode = 'using_quality_scores'
 
+
+
+###############################################################################
+# 
 # When using quality scores our scoring function is defined as
 #
 # f: S_e x R x S -> R
@@ -346,6 +357,7 @@ mode = 'using_quality_scores'
 #
 # At ests we do not have gaps with quality scores so we look up the matchmatrix
 # instead.
+###############################################################################
 
 numDonSuppPoints     = 30
 numAccSuppPoints     = 30
@@ -375,6 +387,15 @@ totalQualSuppPoints = numQualPlifs*numQualSuppPoints
 numFeatures = numDonSuppPoints + numAccSuppPoints\
 + numLengthSuppPoints + sizeMatchmatrix[0]*sizeMatchmatrix[1] + totalQualSuppPoints 
 
+
+###############################################################################
+#
+# GENERAL SETTINGS CONCERNING THE SOLVER
+#
+#
+#
+###############################################################################
+
 iter_steps = 40
 remove_duplicate_scores = False
 print_matrix            = False
@@ -387,22 +408,29 @@ elif mode == 'using_quality_scores':
 else:
    assert False, 'Wrong operation mode specified'
 
+###############################################################################
+#
+# DATA SETTINGS CONCERNING THE SPLITS AND FILE LOCATIONS
 #
 #
+#
+###############################################################################
+
 training_begin    =    0
-training_end      = 1000
-prediction_begin  =    0
-prediction_end    = 1000
+training_end      = 1500
 
+prediction_begin  = 1500
+prediction_end    = 2200
 
-#
-#
-#
 dna_filename         = '/fml/ag-raetsch/share/projects/qpalma/solexa/allGenes.pickle'
 est_filename         = '/fml/ag-raetsch/share/projects/qpalma/solexa/filteredReads_recent'
 tair7_seq_filename   = '/fml/ag-raetsch/share/projects/qpalma/solexa/tair7_seq.pickle'
 
-# Check for valid parameters
+###############################################################################
+#
+# SANITY CHECKS
+#
+###############################################################################
 assert numQualPlifs       >= 0
 assert numDonSuppPoints    > 1
 assert numAccSuppPoints    > 1
@@ -412,3 +440,4 @@ assert numQualSuppPoints   > 1
 assert os.path.exists(dna_filename), 'DNA data does not exist!'
 assert os.path.exists(est_filename), 'EST/Reads data does not exist!'
 assert os.path.exists(tair7_seq_filename), 'Sequence data does not exist!'
+