+ fixed mentioned index bugs of the SpliceAlign of the ground truth
authorfabio <fabio@e1793c9e-67f9-0310-80fc-b846ff1f7b36>
Wed, 12 Mar 2008 14:28:24 +0000 (14:28 +0000)
committerfabio <fabio@e1793c9e-67f9-0310-80fc-b846ff1f7b36>
Wed, 12 Mar 2008 14:28:24 +0000 (14:28 +0000)
git-svn-id: http://svn.tuebingen.mpg.de/ag-raetsch/projects/QPalma@8134 e1793c9e-67f9-0310-80fc-b846ff1f7b36

qpalma/Configuration.py
qpalma/DataProc.py
qpalma/computeSpliceAlignWithQuality.py
qpalma/computeSpliceWeights.py

index 12a5a51..44b9be5 100644 (file)
@@ -24,7 +24,7 @@ fixedParamQ = cPickle.load(open('/fml/ag-raetsch/home/fabio/svn/projects/QPalma/
 #min_qual = -5
 #max_qual = 40
 
-numConstraintsPerRound = 50
+numConstraintsPerRound = 5
 
 ###############################################################################
 # 
@@ -113,10 +113,10 @@ else:
 #
 ###############################################################################
 training_begin    =  0
-training_end      =  5000
+training_end      =  50
 
-prediction_begin  =  5000
-prediction_end    =  20000
+prediction_begin  =  50
+prediction_end    =  3000
 
 joinp = os.path.join
 
index c93a686..904d91c 100644 (file)
@@ -20,19 +20,14 @@ def paths_load_data(filename,expt,genome_info,PAR,test=False):
    #data = io_pickle.load(filename)
    data = cPickle.load(open(filename))
 
-   Sequences   = data[0]
-   Acceptors   = data[1]
-   Donors      = data[2]
-   Exons       = data[3]
-   Ests        = data[4]
-   OriginalEsts= data[5]
-   Qualities   = data[6]
-   UpCut       = data[7]
-   StartPos    = data[8]
-   AlternativeSequences = data[9]
-
-   return Sequences, Acceptors, Donors, Exons, Ests, OriginalEsts, Qualities,\
-   UpCut, StartPos, AlternativeSequences
+   SeqInfo     = data[0]
+   Exons       = data[1]
+   OriginalEsts= data[2]
+   Qualities   = data[3]
+   AlternativeSequences = data[4]
+
+   return SeqInfo, Exons, OriginalEsts, Qualities,\
+   AlternativeSequences
 
 
 def paths_load_data_solexa(expt,genome_info,PAR,test=False):
index ae6e646..04283d7 100644 (file)
@@ -19,13 +19,11 @@ def  computeSpliceAlignWithQuality(dna, exons, est, original_est, quality, quali
    cccccXXcccccA1cccccE1 ... Em-1cccXXcccccccc
    """
 
-   numberOfExons = (exons.shape)[0] # how many rows ?
+   numberOfExons = 2
    exonSizes = [-1]*numberOfExons
 
-   #assert numberOfExons == 3
-
-   for idx in range(numberOfExons):
-      exonSizes[idx] = exons[idx,1] - exons[idx,0]
+   exonSizes[0] = exons[0,1] - exons[0,0]
+   exonSizes[1] = exons[1,1] - exons[1,0]
 
    # SpliceAlign vector describes alignment: 
    # 1:donorpos, 3:intron 2:acceptorpos, 0:exon, 4: dangling end
@@ -47,9 +45,7 @@ def  computeSpliceAlignWithQuality(dna, exons, est, original_est, quality, quali
 
    assert len(SpliceAlign) == len(dna), pdb.set_trace()
 
-   # number of matches: just have to look at the underlying est
-   # est = dna(find(SpliceAlign==0)) # exon nucleotides
-   exonPos = [pos for pos,elem in enumerate(SpliceAlign) if elem == 0]
+   #pdb.set_trace()
 
    #  
    # start of label feature generation
index 51cfc7f..78cf9df 100644 (file)
@@ -54,7 +54,6 @@ def computeSpliceWeights(d, a, h, SpliceAlign, don_supp, acc_supp):
    # Picke die Positionen raus, an denen eine Donorstelle ist
    try:
       DonorScores = [elem for pos,elem in enumerate(don_supp) if SpliceAlign[pos] == 1]
-
       assert not ( -inf in DonorScores )
    except:
       print 'Error'
@@ -69,11 +68,7 @@ def computeSpliceWeights(d, a, h, SpliceAlign, don_supp, acc_supp):
 
    #Den Vektor Acceptorstellen durchgehen und die Gewichtsvektoren belasten:
    try:
-      #if dec:
-      #AcceptorScores = [elem for pos,elem in enumerate(acc_supp) if pos > 0 and SpliceAlign[pos-1] == 2]
-      AcceptorScores = [elem for pos,elem in enumerate(acc_supp) if pos > 0 and SpliceAlign[pos-1] == 2]
-      #else:
-      #   AcceptorScores = [elem for pos,elem in enumerate(acc_supp) if pos > 0 and SpliceAlign[pos] == 2]
+      AcceptorScores = [elem for pos,elem in enumerate(acc_supp) if pos > 0 and SpliceAlign[pos] == 2]
       assert not ( -inf in AcceptorScores )
    except:
       print 'Error'