Commit for generating prediction report

c5fd99a0 · Hotwani · 64cb9f8b · c5fd99a0
Commit c5fd99a0 authored 4 years ago by Hotwani
Hide whitespace changes
Inline Side-by-side

Showing

with 32 additions and 28 deletions
+32 -28
--- a/main.py
+++ b/main.py
@@ -37,31 +37,32 @@ def extract_features(trainingDataDir, trainingDataSubDirs):
    create_csv_header()
    # Looping over every file inside the subdirectories for feature extraction
    for trainingDataSubDir in trainingDataSubDirs:
-        for audio_file_name in os.listdir(trainingDataDir/f'{trainingDataSubDir}'):
+        if os.path.isdir(trainingDataSubDir):
-            if audio_file_name.endswith(".wav"):
+            for audio_file_name in os.listdir(trainingDataDir/f'{trainingDataSubDir}'):
-                audio_file = trainingDataDir/f'{trainingDataSubDir}/{audio_file_name}'
+                if audio_file_name.endswith(".wav"):
-                print("Extracting Features from Directory "+trainingDataSubDir+" and file "+audio_file.name)
+                    audio_file = trainingDataDir/f'{trainingDataSubDir}/{audio_file_name}'
-                y, sr = librosa.load(audio_file, mono=True)
+                    print("Extracting Features from Directory "+trainingDataSubDir+" and file "+audio_file.name)
-                mfcc_features = librosa.feature.mfcc(y=y, sr=sr,
+                    y, sr = librosa.load(audio_file, mono=True)
-                                                     n_mfcc=(constants.MFCC_RANGE_END - constants.MFCC_RANGE_START))
+                    mfcc_features = librosa.feature.mfcc(y=y, sr=sr,
-                to_append = f'{audio_file.name}'
+                                                         n_mfcc=(constants.MFCC_RANGE_END - constants.MFCC_RANGE_START))
-                for mfcc_segment in mfcc_features:
+                    to_append = f'{audio_file.name}'
-                    to_append += f' {np.mean(mfcc_segment)}'
+                    for mfcc_segment in mfcc_features:
-                if trainingDataSubDir == constants.CAR:
+                        to_append += f' {np.mean(mfcc_segment)}'
-                    to_append += f' {constants.LIGHT_WEIGHT}'
+                    if trainingDataSubDir == constants.CAR:
-                elif trainingDataSubDir == constants.BUS:
+                        to_append += f' {constants.LIGHT_WEIGHT}'
-                    to_append += f' {constants.MEDIUM_WEIGHT}'
+                    elif trainingDataSubDir == constants.BUS:
-                elif trainingDataSubDir == constants.TRUCK:
+                        to_append += f' {constants.MEDIUM_WEIGHT}'
-                    to_append += f' {constants.HEAVY_WEIGHT}'
+                    elif trainingDataSubDir == constants.TRUCK:
-                elif trainingDataSubDir == constants.MOTORCYCLE:
+                        to_append += f' {constants.HEAVY_WEIGHT}'
-                    to_append += f' {constants.TWO_WHEELED}'
+                    elif trainingDataSubDir == constants.MOTORCYCLE:
-                elif trainingDataSubDir == constants.TRAM:
+                        to_append += f' {constants.TWO_WHEELED}'
-                    to_append += f' {constants.RAIL_BOUND}'
+                    elif trainingDataSubDir == constants.TRAM:
+                        to_append += f' {constants.RAIL_BOUND}'
-                file = open(constants.FEATURES_CSV_NAME, 'a', newline='')
-                with file:
+                    file = open(constants.FEATURES_CSV_NAME, 'a', newline='')
-                    writer = csv.writer(file)
+                    with file:
-                    writer.writerow(to_append.split())
+                        writer = csv.writer(file)
+                        writer.writerow(to_append.split())
 def preprocessing_csv_data():
@@ -121,17 +122,20 @@ def train_and_save_model(compiledModel, X_train, y_train, X_test, y_test):
                                         callbacks=[tensorboard_callback])
    # Saving the trained model to avoid re-training
-    #print(training_history)
    compiledModel.save(constants.TRAINED_MODEL)
    return training_history
-def predict(X_test, y_test):
+def predict(X_test, y_test, encoder):
    print("Predictions.....")
    final_predictions = np.argmax(compiled_model.predict(X_test), axis=-1)
    target_names = [constants.LIGHT_WEIGHT, constants.MEDIUM_WEIGHT, constants.HEAVY_WEIGHT, constants.TWO_WHEELED,
                    constants.RAIL_BOUND]
+    test_labels = encoder.inverse_transform(y_test)
+    output_labels = encoder.inverse_transform(final_predictions)
    print(classification_report(y_test, final_predictions, target_names=target_names))
+    df = pd.DataFrame({"Actual Output": test_labels, "Predicted Output": output_labels})
+    df.to_csv(r'prediction_report.csv', index=False)
 # Changing Directory to Training Dataset Folder
@@ -145,4 +149,4 @@ X_input_features = normalize_data(processed_features_data)
 X_train_data, X_test_data, y_train_data, y_test_data = train_test_data_split(X_input_features, target_audio_labels)
 compiled_model = create_and_compile_model()
 model_training_history = train_and_save_model(compiled_model, X_train_data, y_train_data, X_test_data, y_test_data)
-predict(X_test_data, y_test_data)
+predict(X_test_data, y_test_data, encoder_object)