carboseq_s: csopraSplitInput.py comparison

comparison csopraSplitInput.py @ 14:e455667fe22f draft

"planemo upload for repository https://forgemia.inra.fr/carboseq/record-projet-carboseq/-/tree/494bf06621d4e5799cab9ef8384d4411a2cd4b84/toos/CarboSeqSimulator commit 494bf06621d4e5799cab9ef8384d4411a2cd4b84-dirty"

author	siwaa
date	Fri, 20 Sep 2024 09:00:02 +0000
parents	20886bc40659
children

comparison

equal deleted inserted replaced

-:9ad79c2d8e0b
+:e455667fe22f
 os.mkdir(output_folder)
 dfs = pd.read_csv(soil_path)
 dfc = pd.read_csv(crop_path)
+fileS = open(soil_path, 'r')
+fileC = open(crop_path, 'r')
+LineS = fileS.readlines()
+LineC = fileC.readlines()
+headerS = LineS.pop(0)
+headerC = LineC.pop(0)
 dfs['ID'] = dfs['ID'].astype('int')
 dfc['ID'] = dfc['ID'].astype('int')
 IDs = dfs['ID'].unique()
 firstID = IDs[(i-1) * step]
 lastID = IDs[min((i * step) - 1 , max_ID - 1)]
 splitIDs = IDs[(i-1) * step : min((i * step) , max_ID)]
+whereS = dfs['ID'].isin(splitIDs)
+whereSid = whereS[whereS].index.values
+firstSid = min(whereSid)
+lastSid = max(whereSid)
+lineSsplit = LineS[firstSid:lastSid+1]
-dfSplit = pd.DataFrame()
+whereC = dfc['ID'].isin(splitIDs)
-dfSplit = dfs[dfs['ID'].isin(splitIDs)]
+whereCid = whereC[whereC].index.values
+firstCid = min(whereCid)
-dfcSplit = pd.DataFrame()
+lastCid = max(whereCid)
-dfcSplit = dfc[dfc['ID'].isin(splitIDs)]
+lineCsplit = LineC[firstCid:lastCid+1]
 os.mkdir(os.path.join(output_folder, f"{input_folder}_{i}"))
 shutil.copy(unit_path, os.path.join(output_folder, f"{input_folder}_{i}"))
-dfSplit.to_csv(os.path.join(output_folder, f"{input_folder}_{i}", "soil.csv"), index=False)
-dfcSplit.to_csv(os.path.join(output_folder, f"{input_folder}_{i}", "crop.csv"), index=False)
+splitFileS = open(os.path.join(output_folder, f"{input_folder}_{i}", "soil.csv"), 'w')
+splitFileS.writelines(headerS)
+splitFileS.writelines(lineSsplit)
+splitFileS.close()
+splitFileC = open(os.path.join(output_folder, f"{input_folder}_{i}", "crop.csv"), 'w')
+splitFileC.writelines(headerC)
+splitFileC.writelines(lineCsplit)
+splitFileC.close()
 shutil.make_archive( os.path.join(output_folder,f"{input_folder}_{i}"), 'zip',  os.path.join(output_folder, f"{input_folder}_{i}"))
 # Example usage
 input_folder = "input"
 output_folder = "outputs"

Mercurial > repos > siwaa > carboseq_s

comparison csopraSplitInput.py @ 14:e455667fe22f draft