+ changed interface for decoded plif features -> directly access double array
[qpalma.git] / python / Configuration.py
index 419b0be..554ec24 100644 (file)
@@ -54,6 +54,7 @@ fixedParam = numpy.matlib.mat(
        [ 0.08188783], [ 0.54884803], [ 0.84039558], [ 0.6982093 ], [ 0.41686176],
        [ 0.38568873], [ 0.29401347], [ 0.12704074], [ 0.30640858], [ 0.89578031],
        [ 0.84621571], [ 0.11783439], [ 0.0944695 ], [ 0.34081575], [ 0.44157643],
+       [ 0.84621571], [ 0.11783439], [ 0.0944695 ], [ 0.34081575], [ 0.44157643],
        [ 0.77847185], [ 0.04283567], [ 0.45107823], [ 0.89789891], [ 0.41045519],
        [ 0.49073531], [ 0.29727627], [ 0.94711483], [ 0.24898204], [ 0.26181212],
        [ 0.71760957], [ 0.60326883], [ 0.80887576], [ 0.09448718], [ 0.88064525],
@@ -79,7 +80,7 @@ fixedParam = numpy.matlib.mat(
 #
 #
 
-C = 1.0
+C = 100.0
 
 # 'normal' means work like Palma 'using_quality_scores' means work like Palma
 # plus using sequencing quality scores
@@ -92,7 +93,9 @@ mode = 'using_quality_scores'
 
 # When using quality scores our scoring function is defined as
 #
-# f: S x R x S -> R
+# f: S_e x R x S -> R
+#
+# where S_e is {A,C,G,T,N} and S = {A,C,G,T,N,-}
 # 
 # as opposed to a usage without quality scores when we only have
 # 
@@ -103,19 +106,22 @@ numAccSuppPoints     = 30
 numLengthSuppPoints  = 30 
 numQualSuppPoints    = 4
 
+min_qual = -1
+max_qual = 40
+
 if mode == 'normal':
-   sizeMMatrix          = 36
+   sizeMatchmatrix   = (6,6)
    numQualPlifs = 0
 elif mode == 'using_quality_scores':
-   sizeMMatrix          = 36 
-   numQualPlifs = 5*5
+   sizeMatchmatrix   = (6,6)
+   numQualPlifs = 5*5 #5*6
 else:
    assert False, 'Wrong operation mode specified'
 
 totalQualSuppPoints = numQualPlifs*numQualSuppPoints
 
 numFeatures = numDonSuppPoints + numAccSuppPoints\
-+ numLengthSuppPoints + sizeMMatrix + totalQualSuppPoints 
++ numLengthSuppPoints + sizeMatchmatrix[0]*sizeMatchmatrix[1] + totalQualSuppPoints 
 
 iter_steps = 2
 remove_duplicate_scores = False